Let us survey the previous cases of encoding texts into structured forms for using the machine learning algorithms to text mining tasks. The three main problems, huge dimensionality, sparse distribution, and poor transparency, have existed inherently in encoding them into numerical vectors. In previous works, various schemes of preprocessing texts have been proposed, in order to solve the problems. In this survey, we focus on the process of encoding texts into alternative structured forms to numerical vectors. In other words, this section is intended to explore previous works on solutions to the problems.
우리 채광 작업 텍스트 기계 학습 알고리즘을 사용하는 형태로 구조화 인코딩 텍스트의 이전 사건을 조사하자. 세 가지 주요 문제, 거대한 차원, 스파 스 유통, 가난한 투명성, 수치 벡터로를 인코딩에 본질적으로 존재하고있다. 기존 연구에서는 전처리 텍스트의 다양한 방식이 과제를 해결하기 위해 제안되었다. 이 설문 조사에서, 우리는 수치 벡터 대안 구조화 된 형태로 텍스트를 인코딩하는 과정에 초점을 맞 춥니 다. 즉,이 부분은 문제에 대한 해결책에 이전 작품을 탐구하기위한 것입니다.
번역되고, 잠시 기다려주십시오..
![](//koimg.ilovetranslation.com/pic/loading_3.gif?v=b9814dd30c1d7c59_8619)