추천(3)
-
[영화 추천 인공지능 만들기] (4) 평가 Matrix 만들기, 입력한 영화와 비슷한 영화 추천하기
3번 Cell) 필요한 칼럼만 추려서 저장하기 ㆍ1줄) meta에 불러온 csv파일에서 필요한 칼럼만 추려서 다시 meta에 저장. ㆍ2줄) id칼럼의 이름을 movieId로 변경하여 저장 ㆍ3줄) original_language가 en로 되어있는 영화만 추려서 다시 meta에 저장. 4번 Cell) 평가정보 csv파일 불러오고 필요한 칼럼만 추려서 저장하기 ㆍ2줄) ratings에 불러온 csv파일에서 필요한 칼럼만 추려서 다시 meta에 저장. 5번 Cell) ratings에 저장된 테이블 데이터의 개요를 확인 6, 7번 Cell) movieId를 숫자형식으로 변환, genres를 보기 편하게 변환 ㆍ6번 Cell) 문자열 형식인 movieId를 숫자형식으로 변환한다. - errors = 'coerc..
2021.03.25 -
[영화 추천 인공지능 만들기] (3) 데이터 불러오기
www.youtube.com/watch?v=mLwMe4KUZz8 위 유튜브 설명을 토대로 실습을 진행하였습니다. 이 글은 각 과정을 분석하며 학습하는 목적으로 작성되었습니다. 1번 Cell) 라이브러리 가져오기 ㆍnumpy - 수치 데이터를 다루는 파이썬 패키지. Numpy의 핵심이라고 불리는 다차원 행렬 자료구조인 ndarray를 통해 벡터 및 행렬을 사용하는 선형 대수 계산에서 주로 사용된다. 편의성, 속도면에서 순수 파이썬에 비해 압도적으로 앞선다는 장점이 있다. - Numpy의 주요 모듈 1. np.array() # 리스트, 튜플, 배열로 부터 ndarray를 생성 2. np.asarray() # 기존의 array로 부터 ndarray를 생성 3. np.arange() # range와 비슷 4. ..
2021.03.25 -
[영화 추천 인공지능 만들기] (1) 피어슨 상관 계수에 대한 이해 (Pearson Correlation Coefficient)
파이썬 인공지능 실습을 진행중이다. 이에 선행되어야 할 피어슨 상관 관계에 대한 개념 이해를 위해 짚고 넘어가기로 한다. [개념] ㆍ피어슨 상관 계수란? - 두 변수의 상관관계를 의미하는 수치 - 0을 기준으로 +1은 완벽한 양의 상관 관계, -1은 완벽한 음의 상관 관계를 의미. ㆍ변수 X와 Y의 'Pearson Correlation Coefficient' 식 - X, Y는 각 각 벡터 - 'Xi'는 해당 벡터의 각 항목 값 - 'X_'는 해당 벡터의 표본 평균 값 위 식을 풀어 쓴다면 1. 각 벡터에서 해당 값을 Normalization 한다. = 각 벡터의 각 원소 값에서 평균 값을 빼준다. 2. X벡터와 Y벡터에서 Normalization된 값들 끼리 Cosine Similarity를 계산한다. ..
2021.03.24