최근 한국어 데이터 전처리를 해야할 일이 있어서, 이것저것 찾아보다가 pororo란 package를 알게되었다.
Deep learning 기반으로 전처리를 해주고, 성능이 쓸만한 것 같아서 설치를 시도해보았다.
설치하려고 문서를 찾아보면서 알게된 것이지만, 해당 package는 KAKAO brain에서 release를 했으며, 4년 전부터 version 관리되지 않는 것으로 보인다
https://github.com/kakaobrain/pororo
GitHub - kakaobrain/pororo: PORORO: Platform Of neuRal mOdels for natuRal language prOcessing
PORORO: Platform Of neuRal mOdels for natuRal language prOcessing - kakaobrain/pororo
github.com
그로인해, 메인 페이지에서는 torch version도 1.6을 권장했지만, 다른 프로그램에서는 그것보다 상위버전을 사용하기에 다운그레이드를 할 수는 없었다.
설치하다가, 여러번 실패를 맛보고, 아래 블로그에 개발자분이 설명해준 내용을 바탕으로 설치는 어찌 성공하였다.
험난한 Pororo 설치 여정 😶
카카오브레인 Pororo 라이브러리 설치
until.blog
이제 내가 한 부분을 정리해보면 다음과 같다.
git clone https://github.com/kakaobrain/pororo.git
torch==1.6.0 => torch>=1.6.0
torchvision==0.7.0 => torchvision>=0.7.0
uv pip install .
sed -i 's/torch.load(f, map_location=torch.device("cpu"))/torch.load(f, map_location=torch.device("cpu"), weights_only=False)/' \
/usr/local/lib/python3.10/site-packages/fairseq/checkpoint_utils.py || true
댓글 영역