단어의 표현 방법
Local Representation특정 단어를 1개의 벡터에 매핑 ( ex: dog - 1 , cat - 2 ) 1. One-hot Vector 한 단어를 1개의 벡터와 매핑 ex) dog - [0,0,1,0,0] 2. N-gramn-1개의 단어 시퀀스를 1개의 벡터와 매핑ex) I am - [0,0,0,0,1] 3. Bag of Words문장에 나온 각 단어의 빈도수를 한개의 벡터에 저장"I and you and my brother are students"(1) 해당 문장을 단어집합으로 만듦dict = {I : 0 , and : 1 , you : 2 , my : 3 , brother : 4 , are : 5 , students : 6}(2) 크기가 n(단어 개수)=6 인 벡터 생성BoW = [0,0..
2024. 5. 14.
데이터 분리
1. X, y 분리 (1) zip 함수를 이용X, y = zip([['a', 1 ], ['b', 2 ], ['c', 3 ]])# 리스트 변수명을 사용할 경우data = [['a', 1 ], ['b', 2 ], ['c', 3 ]]X, y = zip(*data) (2) 데이터프레임 이용values = [['hi' , 1 ], ['bye', 0 ], ['hello' , 1 ]]columns = ['인사' , '종류' ]df = pd.DataFrame(values, columns = columns) (3) numpy 이용np_array = np.arange(16).reshape((4,4))#마지막 열은 y값으로 사용X = np_array[:,:3]y = np_array[:,3] 2. train , test 데이..
2024. 5. 14.