Once some texts are selected as attributes, we need to consider the schemes of defining a value to each attribute. To each attribute, we may assign a binary value indicating whether the word present in the text which is given as the attribute, or not. We may use the relative frequency of the word in each text which is an attribute as a feature value. The weight of word to each attribute which is computed by equation (1) may be used as a feature value. Therefore, the attributes values of a numerical vector which represent a word are relationships between the word and the texts which are selected as features.
//////
The feature selection and the feature value assignment for encoding words into numerical vectors depend strongly on the given corpus. When changing the corpus, different texts are selected by different values of the selection criterion as features. Even if same features are selected, different feature values are assigned. Only addition or deletion of texts in the given corpus may influence on the feature selection
and the assignment of feature values. In order to avoid the dependency, we may consider the word net or the dictionary as alternatives to the corpus.
일부 텍스트가 속성으로 선택되면, 우리는 각 속성에 값을 정의하는 방식을 고려할 필요가있다. 각각의 특성에, 우리는 속성 여부로 주어진 텍스트에 존재하는지 여부를 나타내는 단어 이진 값을 할당 할 수있다. 우리는 특징 량 등의 속성 각 텍스트 단어의 상대적인 빈도를 이용할 수있다. 식 (1)에 의해 계산되는 각각의 속성 워드의 중량을 특징 값으로 사용할 수있다. 따라서, 단어가 나타내는 수치 벡터의 속성 값은 워드 및 기능으로서 선택되는 텍스트 사이의 관계이다. ////// 기능 선택과 수치 벡터로 단어를 부호화하는 특징 량 할당 강하게 의존 주어진 코퍼스. 코퍼스를 변경하는 경우, 다른 텍스트는 기능과 선택 기준의 다른 값으로 선택되어 있습니다. 동일한 기능을 선택하는 경우에도, 서로 다른 특성 값이 할당된다. 주어진 코퍼스 단지 텍스트의 부가 또는 삭제는 기능의 선택에 영향을 줄 수 와 특징 값의 할당. 의존성을 피하기 위해, 우리는 워드 넷 또는 코퍼스의 대안으로서 사전을 고려할 수있다.
번역되고, 잠시 기다려주십시오..

일단 좀 텍스트 선택 (속성, 우리는 반드시 고려해야 방안을 각 속성 정의 가치가 있다.우리는 모든 속성 값 가 있는지 지금 그 말 있다며 문자 속성, 안 된다.상대 주파수 사용할 수 있습니다. 이 모든 텍스트 단어 속성 한 특징은 가치가 있다.무게 있는 글자 한 계산 속성 방정식 (1) 사용 가능한 특징은 가치가 있다.그래서 속성 값 대표 수치 매체 한 마디도 관계 및 텍스트 단어 선택 ////// 특징.
선택 특성 특성 및 대입 수치 벡터 인코딩 말 달려있다 보관소 거야.이 재료 바꿀 때, 다른 텍스트 선택 선택 다른 가치 척도 특징.설령 다른 특징 같은 선택 기능 값, 속한다.오직 증감 주어진 라이브러리 텍스트 영향을 기능 선택
양도 및 기능 값.피하기 위해 의존, google은 그 말, 대체 인터넷 자료 사전.
번역되고, 잠시 기다려주십시오..
