기존의 파이썬 리스트 : 여러 개의 값들을 저장할 수 있는 자료구조이지만 다양한 연산 불가, 연산 속도 느림 => 해결방안 : 파이썬 대신 넘파이를 활용한 데이터 처리가 많음(scikit learn, tensorflow) 넘파이 배열 : n개의 축 -> n차원 배열 / c언어에 기반한 배열 구조더하기 연산자 적용시파이썬 리스트2개의 리스트가 연결된 하나의 리스트넘파이 배열대응되는 값이 합쳐진 결과합 구하기 import numpy as np (np는 별칭) mid_scores=np.array([10,20,30]) final_array=np.array([10,20,30]) total=mid_scores+final_array np.sin(A) mid_scores= mid_scores + 100 / *2/ *2..
데이터 마이닝이 이루어지는 과정 data science - 잘 알려진 stage로 이루어진 process problem을 subtasks로 쪼개어 solution을 마련하는 것 각각의 subtask에 대한 solution간의 연관성 존재함 1. Classification ( recognization) 분류 -class들은 상호 배타적임(서로 겹치는 부분이 없음) 10개의 학습데이터에 lable(truth value)를 붙이고 이후 새로운 test 데이터로 시험하기 -general procedure : training dataset -> model 만들기 -a similar task: 점수를 매기거나 class 가능성 예측하기 => 결괏값 도출(class) target: a categorical value..