원핫인코딩
원 핫 인코딩머신러닝 알고리즘은 문자열 데이터 속성을 입력받지 않으며 모든 데이터는 숫자형으로 표현되어야 합니다.따라서 문자형 카테고리형 속성은 모두 숫자 값으로 변환/인코딩 되어야 합니다.원 핫 인코딩 기법은 입력 데이터를 숫자 벡터로 변환하는 방법으로, 각 입력 데이터의 특성을 0과 1의 이진 벡터로 표현합니다.예를 들어, 내가 학습시킬 데이터에 사과/바나나/포도 라는 데이터가 있다면 아래와 같이 3개의 컬럼이 있는 형식으로 표현할 수 있습니다.(여기가 1이면 사과), (여기가 1이면 바나나), (여기가 1이면 포도)(1, 0, 0) --> 이 데이터는 사과를 의미합니다(0, 1, 0) --> 이 데이터는 바나나를 의미합니다(0, 0, 1) --> 이 데이터는 포도를 의미합니다즉, 각 숫자는 단어의 ..
2024. 11. 15.