컴퓨터과학(30)
-
[영화 추천 인공지능 만들기] (4) 평가 Matrix 만들기, 입력한 영화와 비슷한 영화 추천하기
3번 Cell) 필요한 칼럼만 추려서 저장하기 ㆍ1줄) meta에 불러온 csv파일에서 필요한 칼럼만 추려서 다시 meta에 저장. ㆍ2줄) id칼럼의 이름을 movieId로 변경하여 저장 ㆍ3줄) original_language가 en로 되어있는 영화만 추려서 다시 meta에 저장. 4번 Cell) 평가정보 csv파일 불러오고 필요한 칼럼만 추려서 저장하기 ㆍ2줄) ratings에 불러온 csv파일에서 필요한 칼럼만 추려서 다시 meta에 저장. 5번 Cell) ratings에 저장된 테이블 데이터의 개요를 확인 6, 7번 Cell) movieId를 숫자형식으로 변환, genres를 보기 편하게 변환 ㆍ6번 Cell) 문자열 형식인 movieId를 숫자형식으로 변환한다. - errors = 'coerc..
2021.03.25 -
[영화 추천 인공지능 만들기] (3) 데이터 불러오기
www.youtube.com/watch?v=mLwMe4KUZz8 위 유튜브 설명을 토대로 실습을 진행하였습니다. 이 글은 각 과정을 분석하며 학습하는 목적으로 작성되었습니다. 1번 Cell) 라이브러리 가져오기 ㆍnumpy - 수치 데이터를 다루는 파이썬 패키지. Numpy의 핵심이라고 불리는 다차원 행렬 자료구조인 ndarray를 통해 벡터 및 행렬을 사용하는 선형 대수 계산에서 주로 사용된다. 편의성, 속도면에서 순수 파이썬에 비해 압도적으로 앞선다는 장점이 있다. - Numpy의 주요 모듈 1. np.array() # 리스트, 튜플, 배열로 부터 ndarray를 생성 2. np.asarray() # 기존의 array로 부터 ndarray를 생성 3. np.arange() # range와 비슷 4. ..
2021.03.25 -
[정보처리기사 실기 / 2020년 1회 기출] 11~20번 풀이
11. 모듈 설계 시 ( )는 낮추고, ( )는 높여야 한다. - 결합도, 응집도 12. (C언어) 다음 코드의 결과 출력은? #include #define SIZE 5 int main() { int arr[SIZE] = {75, 100, 95, 50, 85}; int i, j, temp; for(i=1; i
2021.03.25 -
[영화 추천 인공지능 만들기] (2) Jupyter Notebook으로 환경 조성.
Jupyter Notebook은 브라우저 상에서 파이썬 코드를 단계적으로 실행할 수 있는 프로그램이다. 1. Jupyter Notebook 설치 및 실행 - cmd창을 열고 - 'pip install jupyter'명령어로 설치. - cmd창을 열고 'jupyter notebook'명령어로 실행. - New -> Ptyhon3을 누르면 코딩 환경 완성 2. 기본 조작 - 코드 작성 후 'Ctrl + Enter'를 하면 코드 실행 - 코드 작성 후 'Shift + Enter'를 하면 코드 실행 후 새로운 칸 생성
2021.03.24 -
[영화 추천 인공지능 만들기] (1) 피어슨 상관 계수에 대한 이해 (Pearson Correlation Coefficient)
파이썬 인공지능 실습을 진행중이다. 이에 선행되어야 할 피어슨 상관 관계에 대한 개념 이해를 위해 짚고 넘어가기로 한다. [개념] ㆍ피어슨 상관 계수란? - 두 변수의 상관관계를 의미하는 수치 - 0을 기준으로 +1은 완벽한 양의 상관 관계, -1은 완벽한 음의 상관 관계를 의미. ㆍ변수 X와 Y의 'Pearson Correlation Coefficient' 식 - X, Y는 각 각 벡터 - 'Xi'는 해당 벡터의 각 항목 값 - 'X_'는 해당 벡터의 표본 평균 값 위 식을 풀어 쓴다면 1. 각 벡터에서 해당 값을 Normalization 한다. = 각 벡터의 각 원소 값에서 평균 값을 빼준다. 2. X벡터와 Y벡터에서 Normalization된 값들 끼리 Cosine Similarity를 계산한다. ..
2021.03.24 -
[정보처리기사 실기 / 2020년 1회 기출] 1~10번 풀이
[정보처리기사 실기 / 2020년 1회 기출] 1. 살충제 패러독스란? - 동일 테스트 케이스를 반복하면 새로운 결함을 발견할수 없어지므로 주기적으로 테스트 케이스를 점검하고 개선해야 한다. 2. 데이터 마이닝이란? - 많은 데이터 가운데 의미있는 상관관계를 발견하여 미래에 활용할만한 정보를 추출해 의사결정에 이용하는 과정. 3. 프로토콜의 3요소? - 구문, 타이밍, 의미 4. 웹브라우저간 HTML문법이 호환되지 않는 문제와 SGML의 복잡함을 해결하기 위해 개발된 다목적 마크업 언어는? - XML 5. 속성-쌍 값으로 이루어진 데이터 오브젝트 전달을 위해 사용하는 개방형 표준 포맷이다. AJAX에서 많이 쓰이고 XML을 대체하는 주요 데이터 포맷이다. 언어 독립형 포맷으로 다양한 프로그래밍 언어에서 ..
2021.03.23