tool 공부/PYTHON
kiwi(키위) 형태소 분석기 설치
Zziii
2024. 2. 20. 16:11
728x90
반응형
- kiwipiepy 형태소 분석 설치
1. https://github.com/Kitware/CMake/releases/download/v3.27.0-rc2/cmake-3.27.0-rc2-windows-x86_64.msi
를 통해 파일 다운로드
2. 설치파일 실행
3. Next 클릭
4. 동의 체크 후 Next 클릭
5. 가운데 항목에 체크 후 Next 클릭
6. 경로 바꾸지 않고 그대로 둔채 Next 클릭
7. Install 버튼 클릭해서 설치 완료
8. 설치하고자 하는 가상환경에 kiwipiepy 명령어로 설치
- kiwi 형태소 분석기 명사 추출
kiwi 형태소 분석기로 형태소 분석 후 품사 태깅 된 결과에서
N으로 시작하거나 SL로 시작하는 품사 결과만 가져와서 명사추출하는 코드
* 태그 목록은 다음과 같으니 참고
*출처- https://bab2min.github.io/kiwipiepy/v0.16.2/kr/
아래는 명사 추출 테스트 코드
from kiwipiepy import Kiwi
# Kiwi 객체 생성
kiwi = Kiwi()
# 텍스트를 형태소 분석하여 결과를 반환하는 함수
def analyze_text(text):
result = kiwi.analyze(text)
return result
# 형태소 분석 결과에서 명사를 추출하는 함수
def extract_nouns(text):
nouns = []
result = analyze_text(text)
for token, pos, _, _ in result[0][0]:
if len(token) != 1 and (pos.startswith('N') or pos.startswith('SL')):
nouns.append(token)
return nouns
# 텍스트 예시
text = "안녕하세요. 저는 한국어 형태소 분석기인 Kiwi를 사용하여 명사를 추출하는 예제입니다."
# 명사 추출
nouns = extract_nouns(text)
print(nouns)
728x90
반응형