Bag-of-Words 텍스트 마이닝 분야에서 딥 러닝 기술이 적용되기 이전에 자주 활용되었던 간단한 기법이다. 단어장에 등록된 단어가 어떠한 문장에 얼마나 등장했는지를 벡터(vector)로 표현하며, 단어장을 구성하는 과정을 필요로 한다. 먼저 텍스트 데이터 셋에서 unique한 단어들만 모아서 단어장(사전)을 구축한다. This is the most powerful device.That is the strongest equipment. 단어장단어장(Vocabulary):{this, is, the, most, powerful, device, that, strongest, equipment} 중복된 단어를 제거하고 최종적으로 단어장..
글 주소를 복사했습니다
부족한 글 끝까지 읽어주셔서 감사합니다. 보충할 내용이 있으면 언제든지 댓글 남겨주세요.
TOP
* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.