알고리즘(2)
-
[영화 추천 인공지능 만들기] (4) 평가 Matrix 만들기, 입력한 영화와 비슷한 영화 추천하기
3번 Cell) 필요한 칼럼만 추려서 저장하기 ㆍ1줄) meta에 불러온 csv파일에서 필요한 칼럼만 추려서 다시 meta에 저장. ㆍ2줄) id칼럼의 이름을 movieId로 변경하여 저장 ㆍ3줄) original_language가 en로 되어있는 영화만 추려서 다시 meta에 저장. 4번 Cell) 평가정보 csv파일 불러오고 필요한 칼럼만 추려서 저장하기 ㆍ2줄) ratings에 불러온 csv파일에서 필요한 칼럼만 추려서 다시 meta에 저장. 5번 Cell) ratings에 저장된 테이블 데이터의 개요를 확인 6, 7번 Cell) movieId를 숫자형식으로 변환, genres를 보기 편하게 변환 ㆍ6번 Cell) 문자열 형식인 movieId를 숫자형식으로 변환한다. - errors = 'coerc..
2021.03.25 -
[영화 추천 인공지능 만들기] (1) 피어슨 상관 계수에 대한 이해 (Pearson Correlation Coefficient)
파이썬 인공지능 실습을 진행중이다. 이에 선행되어야 할 피어슨 상관 관계에 대한 개념 이해를 위해 짚고 넘어가기로 한다. [개념] ㆍ피어슨 상관 계수란? - 두 변수의 상관관계를 의미하는 수치 - 0을 기준으로 +1은 완벽한 양의 상관 관계, -1은 완벽한 음의 상관 관계를 의미. ㆍ변수 X와 Y의 'Pearson Correlation Coefficient' 식 - X, Y는 각 각 벡터 - 'Xi'는 해당 벡터의 각 항목 값 - 'X_'는 해당 벡터의 표본 평균 값 위 식을 풀어 쓴다면 1. 각 벡터에서 해당 값을 Normalization 한다. = 각 벡터의 각 원소 값에서 평균 값을 빼준다. 2. X벡터와 Y벡터에서 Normalization된 값들 끼리 Cosine Similarity를 계산한다. ..
2021.03.24