tool 공부/PYTHON

kiwi(키위) 형태소 분석기 설치

Zziii 2024. 2. 20. 16:11
728x90
반응형

- kiwipiepy 형태소 분석 설치

1. https://github.com/Kitware/CMake/releases/download/v3.27.0-rc2/cmake-3.27.0-rc2-windows-x86_64.msi

를 통해 파일 다운로드

 

2. 설치파일 실행

 

3. Next 클릭

 

4. 동의 체크 후 Next 클릭

 

5. 가운데 항목에 체크 후 Next 클릭

 

6. 경로 바꾸지 않고 그대로 둔채 Next 클릭

 

7. Install 버튼 클릭해서 설치 완료

 

8. 설치하고자 하는 가상환경에 kiwipiepy 명령어로 설치

 

 

 

- kiwi 형태소 분석기 명사 추출

kiwi 형태소 분석기로 형태소 분석 후 품사 태깅 된 결과에서

N으로 시작하거나 SL로 시작하는 품사 결과만 가져와서 명사추출하는 코드

* 태그 목록은 다음과 같으니 참고

*출처- https://bab2min.github.io/kiwipiepy/v0.16.2/kr/

 

 

아래는 명사 추출 테스트 코드

from kiwipiepy import Kiwi

# Kiwi 객체 생성
kiwi = Kiwi()

# 텍스트를 형태소 분석하여 결과를 반환하는 함수
def analyze_text(text):
    result = kiwi.analyze(text)
    return result

# 형태소 분석 결과에서 명사를 추출하는 함수
def extract_nouns(text):
    nouns = []
    result = analyze_text(text)
    for token, pos, _, _ in result[0][0]:
        if len(token) != 1 and (pos.startswith('N') or pos.startswith('SL')):
            nouns.append(token)
    return nouns

# 텍스트 예시
text = "안녕하세요. 저는 한국어 형태소 분석기인 Kiwi를 사용하여 명사를 추출하는 예제입니다."

# 명사 추출
nouns = extract_nouns(text)
print(nouns)
728x90
반응형