텍스트
역사

where TFi is the total frequency in

where TFi is the total frequency in the given text, DFi is the total number of documents including the word, and N is the total number of documents in the corpus. The word-document matrix consists of TF-IDF weights as relations between a word and a document computed by equation (1). Note that the matrix is a very huge one which consists at least of several thousands of words and documents.

//

Let us consider the criterion of selecting text identifiers as features, given labeled sampled words and a text collection. We may set a portion of each text in the given sample words as a criteria for selecting features. We may use the total frequency of the sample words in each text as a selection criterion. However, in this research, we decided the total TF-IDF (Term Frequency and Inverse Document Frequency) which is computed by equation (1) as the criterion. We may combine more than two criteria with each other for selecting
features.

0/5000

다음 언어를 번역: -

다음 언어로 번역: -

결과 (한국어) 1: [복제]

복사!

TFi 주어진된 텍스트에서 총 주파수가 DFi는 단어를 포함 하 여 문서의 총 수 이며 N 모음에 문서의 총 수입니다. Word 문서 매트릭스 TF IDF 가중치 단어와 방정식 (1)에 의해 계산 된 문서 간의 관계로 구성 되어 있습니다. 매트릭스는 매우 거 대 한 하나 이상으로 구성 된 단어와 문서의 수천의. //우리가 고려 하자 기능으로 텍스트 식별자를 선택 하 여 레이블이 지정 된 샘플된 단어와 텍스트 컬렉션의 기준. 우리는 기능을 선택 하기 위한 조건으로 주어진된 샘플 단어에 각 텍스트의 일부를 설정할 수 있습니다. 우리는 선택 기준으로 각 텍스트에서 샘플 단어의 총 주파수를 사용할 수 있습니다. 그러나,이 연구에서 우리는 총 TF-IDF (기간 주파수 및 역 문서 빈도)는 식 (1) 조건으로 하 여 계산을 결정 했다. 우리 선택에 대 한 서로와 두 개 이상의 조건을 결합할 수 있습니다.기능입니다.

번역되고, 잠시 기다려주십시오..

결과 (한국어) 2:[복제]

복사!

TFI는 주어진 텍스트의 전체 주파수이고, DFI 단어를 포함한 문서들의 총 수이고, N은 코퍼스 내의 문서들의 총 수이다. 워드 문서 행렬은 말과 식 (1)에 의해 계산 된 문서 사이의 관계로 TF-IDF 가중치로 구성되어 있습니다. 매트릭스는 단어와 문서의 수천의 적어도 구성되어 매우 큰 하나라고합니다. // 우리는 기능, 주어진 표시 샘플링 단어와 텍스트 컬렉션으로 텍스트 식별자를 선택하는 기준을 살펴 보자. 우리는 기능을 선택하기위한 기준으로 주어진 샘플 단어의 각 텍스트의 일부를 설정할 수 있습니다. 우리는 선택 기준으로서 각각의 텍스트 샘플 단어의 전체 주파수를 사용할 수있다. 그러나, 본 연구에서, 우리는 기준으로서 식 (1)에 의해 계산되는 총 TF-IDF (용어 빈도 및 역 문서 빈도)를 결정했다. 우리는 선택을 위해 서로 두 개 이상의 조건을 결합 할 수 기능을.

번역되고, 잠시 기다려주십시오..

결과 (한국어) 3:[복제]

복사!

i 총 주파수 바로 그 주어진 문자열을 총수는 사업을 것은 파일 포함 말, 파일 개수 (n) 은 총 재료.문서 세 권 행렬 요소 사이 계산 한 글자 한 파일 (1) 방정식.주의를 행렬 구성된 매우 큰 적어도 몇 천 말 파일.

/ /

우리 같은 표준 텍스트 식별자 선택 기능, 이런 말을 한 텍스트 표시 및 수집.우리가 할 수 있는 모든 텍스트 설정 부분에 대해 말을 표준 샘플 한 선택 기능.우리는 사용할 수 있는 어떤 말을 자꾸 주파수 모든 텍스트 선택 기준.근데 이 연구우리 결정 요소 (전체 단어 빈도 계산 역 문서 주파수) 이 모델 (1) 기준으로 삼다.우리는 수 있는 서로 다른 두 개 이상의 표준 선택
특징.

번역되고, 잠시 기다려주십시오..

다른 언어

번역 도구 지원: 갈리시아어, 구자라트어, 그리스어, 네덜란드어, 네팔어, 노르웨이어, 덴마크어, 독일어, 라오어, 라트비아어, 라틴어, 러시아어, 루마니아어, 룩셈부르크어, 리투아니아어, 마라티어, 마오리어, 마케도니아어, 말라가시어, 말라얄람어, 말레이어, 몰타어, 몽골어, 몽어, 미얀마어 (버마어), 바스크어, 베트남어, 벨라루스어, 벵골어, 보스니아어, 불가리아어, 사모아어, 세르비아어, 세부아노, 세소토어, 소말리아어, 쇼나어, 순다어, 스와힐리어, 스웨덴어, 스코틀랜드 게일어, 스페인어, 슬로바키아어, 슬로베니아어, 신디어, 신할라어, 아랍어, 아르메니아어, 아이슬란드어, 아이티 크리올어, 아일랜드어, 아제르바이잔어, 아프리칸스어, 알바니아어, 암하라어, 언어 감지, 에스토니아어, 에스페란토어, 영어, 오리야어, 요루바어, 우르두어, 우즈베크어, 우크라이나어, 웨일즈어, 위구르어, 이그보어, 이디시어, 이탈리아어, 인도네시아어, 일본어, 자바어, 조지아어, 줄루어, 중국어, 중국어 번체, 체와어, 체코어, 카자흐어, 카탈로니아어, 칸나다어, 코르시카어, 코사어, 쿠르드어, 크로아티아어, 크메르어, 클링곤어, 키냐르완다어, 키르기스어, 타갈로그어, 타밀어, 타지크어, 타타르어, 태국어, 터키어, 텔루구어, 투르크멘어, 파슈토어, 펀자브어, 페르시아어, 포르투갈어, 폴란드어, 프랑스어, 프리지아어, 핀란드어, 하와이어, 하우사어, 한국어, 헝가리어, 히브리어, 힌디어, 언어 번역.