justkeepintouch 님의 블로그

  • 홈
  • 태그
  • 방명록

2026/06/18 1

네이버 영화 리뷰 감성 분류하기(TF-IDF, TF), 텍스트 토크나이징, 벡터화

두두둥!이번 시간에는 "네이버 영화 리뷰"를 가지고 긍정/부정 분류하는 딥러닝 모델을 만들어 보자!!개인적으론 이번 실습 실제 영화 리뷰 데이터를 활용하여 하는 작업이다 보니까 젤 재밌었다 우선 데이터는 크게 2가지로 나뉜다정형 데이터(숫자)비정형 데이터(이미지, 문자, 음성)숫자 데이터의 경우 바로 MLP 모델 input에 넣을 수 있지만, 비정형 데이터의 경우 컴퓨터가 해당 데이터를 읽을 수 없기 때문에 컴퓨터가 읽을 수 있는 숫자로 바꿔주는 벡터화 작업이 필요하다 이미지 데이터 전처리 이미지 데이터의 경우 이미 픽셀이라는 숫자로 이루어져 벡터화 작업 없이MLP input에 넣기 위한 1D Flatten 작업만을 진행하면 되지만, 텍스트 데이터 전처리 text 데이터는 문자열 -> 토크나이..

카테고리 없음 2026.06.18
이전
1
다음
더보기
프로필사진

justkeepintouch 님의 블로그

"Hello, World! Just remeber to keep in touch!"

공지사항

  • 나 자신으로 살아가기
  • 분류 전체보기

Tag

비선형함수, 주피터노트북, 선형함수, 선형 비선형, 분류, BCELoss, 벡터 사전, 파이토츠, 딥러닝, 토크나이징, CrossEntropyLoss, crossEntropy, BCEwithLogitsLoss, 네이버 영화 리뷰, 그래프 시각화, 프리징 멈춤현상, 코랩, c++ #명품c++ #디폴트 매개변수 #생성자 초기화 #cin 입력값 받기 #업캐스팅 #가상함수 #virtual, 한국어 깨짐현상, 인공지능,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

Archives

Calendar

«   2026/06   »
일 월 화 수 목 금 토
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바