konlp.tokenize.klt package¶
Submodules¶
konlp.tokenize.klt.autospace module¶
Klt Tokenizer
-
class
konlp.tokenize.klt.autospace.
KltAsp
(dic_path='')[source]¶ Bases:
object
국민대학교 강승식 교수님의 자동 띄어쓰기 기능입니다. 한글 문장이 주어지면 자동 띄어쓰기를 진행 후, 공백(white-space) 기준으로 tokenize를 합니다.
Example
>>> from konlp.tokenize import KltAsp >>> k = KltAsp() >>> k.asp(text="국민대학교자연어처리연구실") ['국민대학교', '자연어처리', '연구실'] >>> k.asp(text="국민대학교자연어처리연구실", split=False) '국민대학교 자연어처리 연구실' >>> k.asp(text="국민대학교자연어처리연구실", split=True) ['국민대학교', '자연어처리', '연구실']