일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- AI
- pandas
- nvidia
- 인공지능
- EarlyStopping
- ML
- 머신러닝
- nvcc
- json
- semi-project
- aof
- selenium
- 트러블슈팅
- beautifulsoup
- SMTP
- 파일입출력
- 잡담
- 이것이 코딩 테스트다
- Roc curve
- PYTHON
- auc
- cuda
- IOPub
- Logistic linear
- Trouble shooting
- 그리디
- category_encoders
- 크롤링
- nvidia-smi
- Django
Archives
- Today
- Total
목록tf-idf (1)
개발 블로그

01 TF-IDF (Term Frequency - Inverse Document Frequency) TF-IDF(Term Frequency - Inverse Document Frequency)는 정보 검색과 텍스트 마이닝에서 이용하는 가중치로, 여러 문서로 이루어진 문서군이 있을 때 어떤 단어가 특정 문서 내에서 얼마나 중요한 것인지를 나타내는 통계적 수치입니다. 문서의 핵심어를 추출하거나, 검색 엔진에서 검색 결과의 순위를 결정하거나, 문서들 사이의 비슷한 정도를 구하는 등의 용도로 사용할 수 있습니다. (출처 : wiki tf-idf) 02 Cosine Similarity (코사인 유사도) 코사인 유사도(cosine similarity)는 내적공간의 두 벡터간 각도의 코사인값을 이용하여 측정된 벡터간..
Programming Language/Python
2022. 3. 28. 20:35