일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- nvidia-smi
- IOPub
- aof
- Roc curve
- 트러블슈팅
- 그리디
- Django
- cuda
- 이것이 코딩 테스트다
- Logistic linear
- ML
- SMTP
- nvidia
- semi-project
- AI
- 인공지능
- auc
- 크롤링
- PYTHON
- EarlyStopping
- 파일입출력
- beautifulsoup
- category_encoders
- selenium
- json
- pandas
- nvcc
- Trouble shooting
- 잡담
- 머신러닝
Archives
- Today
- Total
목록sklearn (1)
개발 블로그

01 TF-IDF (Term Frequency - Inverse Document Frequency) TF-IDF(Term Frequency - Inverse Document Frequency)는 정보 검색과 텍스트 마이닝에서 이용하는 가중치로, 여러 문서로 이루어진 문서군이 있을 때 어떤 단어가 특정 문서 내에서 얼마나 중요한 것인지를 나타내는 통계적 수치입니다. 문서의 핵심어를 추출하거나, 검색 엔진에서 검색 결과의 순위를 결정하거나, 문서들 사이의 비슷한 정도를 구하는 등의 용도로 사용할 수 있습니다. (출처 : wiki tf-idf) 02 Cosine Similarity (코사인 유사도) 코사인 유사도(cosine similarity)는 내적공간의 두 벡터간 각도의 코사인값을 이용하여 측정된 벡터간..
Programming Language/Python
2022. 3. 28. 20:35