분류 전체보기350 [Python] Pandas - 5. 데이터프레임 출력, 타입, 전치, 미리보기, 기술통계, 통계값(집계/상관계수 등) [공식문서] https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.html 시리즈 속성과 메서드 게시글에서 언급했듯이 어트리뷰트는 괄호를 쓰지 않고, 메서드는 괄호( )를 사용한다. 또한 접근하고자 하는 데이터 뒤에 점을 찍고 사용하며 연결해서 사용할 수도 있다.(메서드체이닝) 1. 인덱스 출력 및 지정 1) 인덱스 출력 데이터프레임명.index 2) 인덱스 지정 데이터프레임명.index = [index로 지정할 것] # 기본 값은 RangeIndex이다. 2. 컬럼명 출력 데이터프레임명.columns 3. value 값 출력 데이터프레임명.values 모든 값을 출력, numpy array형식으로 출력 4. 데이터 타입 .. Python/Pandas 2022. 10. 26. [Python] Pandas - 4. 데이터프레임 기본개념, 생성, 인덱싱과 슬라이싱(출력) [공식문서] https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.html 1. 데이터프레임이란? 1) 2차원 배열로, 행과 열로 구성되어 있다. 2) 각 열은 각각의 데이터 타입(dtype)을 가진다. 2. 데이터프레임 생성하기 pd.DataFrame( [ ] )을 사용해서 데이터프레임을 생성할 수 있다. 1) 리스트를 통해 생성(2차원 리스트를 대입) 생성 시 columns를 지정하면 각 열에 대한 컬럼명을 지정할 수 있다. pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]], columns = ['컬럼1', '컬럼2', '컬럼3']) 2) 딕셔너리를 통해 생성 딕셔너리의 key값이 자동.. Python/Pandas 2022. 10. 26. [Python] Pandas - 3. 시리즈 어트리뷰트와 메서드 시리즈의 속성과 메서드에 대해 알아보자. [시리즈 공식문서] https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.html?highlight=series#pandas.Series 공식문서에서 시리즈에서 사용할 수 있는 속성과 메서드를 자세하게 확인할 수 있다. 참고로 어트리뷰트는 괄호를 쓰지 않고, 메서드는 괄호( )를 사용하니 꼭 기억하자. 또한 접근하고자 하는 데이터 뒤에 점을 찍고 사용하며 연결해서 사용할 수도 있다.(메서드체이닝) 1. values - 데이터 값(value)만 가져오기 시리즈명.values value 값만 numpy array 형식으로 가져온다. 2. ndim - 시리즈의 차원 출력 시리즈명.ndim 시리.. Python/Pandas 2022. 10. 26. [Python] Pandas - 2. 시리즈 기본개념, 시리즈 생성, 인덱싱, 슬라이싱 [시리즈 공식문서] https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.html?highlight=series#pandas.Series 1. Series란? 시리즈는 1차원 배열이다. 인덱스가 사용가능하고, 데이터 타입(dtype)을 갖는다. 2. 시리즈 생성 1) 값을 변수에 할당하고 변수로 생성하기 arr = np.arange(10, 15) # numpy array로 리스트 생성 ser = pd.Series(arr) 2) 리스트를 사용해서 생성하기 snack = pd.Series(["포카칩", "새우깡", "포스틱", "홈런볼"]) 단, series에 다양한 데이터 타입(str, int 등)이 섞여있다면 object 타입으.. Python/Pandas 2022. 10. 26. [Python] Pandas - 1. 기본개념, 파일 불러오기 파이썬에서 정말 정말 자주 사용하는 라이브러리 중 하나인 pandas에 대해 하나씩 배워보도록 하겠다. [판다스 공식문서] https://pandas.pydata.org/docs/reference/index.html 1. Pandas란? pandas는 행과 열 구조의 데이터 분석 도구로 두 가지 대표적인 자료 구조가 있다. 1) DataFrame: 행렬, 2차원 구조 2) Series: 벡터, 1차원 구조 2. 라이브러리 로드 import pandas as pd 판다스의 별칭은 주로 pd를 사용한다. 3. 파일 불러오고 저장하기 1) 엑셀 불러오기 pd.read_excel('파일명.xlsx') 2) CSV 파일 불러오기 pd.read_csv('파일명.csv') 파일명 뒤 확장자는 대소문자를 구분하니 참고.. Python/Pandas 2022. 10. 26. [Python] 3. 함수 지난 번에 파이썬 기초로 자료형, 제어문에 대해 배웠다. 이번에는 파이썬 함수에 대해 배워보자. 자료형 보러가기: 제어문 보러가기: 파이썬에서 함수는 우리가 익히 알고 있는, 수학에서 함수의 개념과 유사하다. ( y = f(x) ) 반복적으로 사용되는 가치 있는 부분을 함수로 만드는데, 어떤 입력값(x)을 주었을 때 어떤 결과값(y)을 돌려주는 식으로 함수 내부를 구성해야 한다. 함수를 만들어두면, 반복적으로 같은 내용을 수행해야할 경우 매우 유용할 것이다. 1. 기본구조 def 함수이름(인자): 내용 2. 매개변수 가. 매개변수(parameter) - def cal(c, b, a): 에서 c, b, a가 매개변수이다. 나. 실행인자(argument) - cal 함수 실행 시 입력하는 c, b, a의 값.. Python/개념정리 2022. 10. 26. [Python] 2. 제어문(조건문, 반복문) 멋쟁이 사자처럼 AI 스쿨 7기 박조은 강사님의 수업 내용 및 자료를 바탕으로 포스팅하였습니다. 지난 시간에 파이썬에서 사용하는 자료 형태에 대해 배워보았다. 이번에는 제어문(조건문, 반복문)에 대해 배워 볼 예정이다. 자료형 보러가기 1. 조건문(if) 가. 기본개념 - if: 조건 생성 - elif: 조건 추가 - else: 그 외 나. 기본구조 - 조건문 다음 콜론(:)과 들여쓰기(4칸)는 매우 중요하다. if 조건문: 수행할 문장 elif 조건문: 수행할 문장 ... else: 수행할 문장 다. in, not in, isin - x in 리스트, 튜플, 문자열 - x not in 리스트, 튜플, 문자열 - isin df.isin() 라. pass - 조건문에서 아무 일도 하지 않게 설정하고 싶지만.. Python/개념정리 2022. 10. 26. [Python] 1. 자료형 파이썬에서 사용하는 자료 형태에 대해서 배워보자. 1. 숫자형 가. 타입 - 정수(int), 실수(float), 복소수(complex) (※ 정수 ⊂ 실수 ⊂ 복소수) - type( ) : 객체의 자료형(타입) 확인하기 - int( ): 정수화 - float( ): 실수화 int(3.3) = 3 나. 사칙연산 너무나 당연하게도 파이썬에서는 사칙연산 기호를 활용하여 사칙연산을 할 수 있다. 사칙연산 🖊️ 몫과 나머지를 함께 구하고 싶다면? - divmod를 사용하면 된다. - divmod(5,2) = (2,1) - 위 처럼 (몫, 나머지) 튜플 형태로 값이 출력된다. 다. 연산자 관계연산자 대입연산자 2. 문자열 자료형 가. 문자열(string) 생성 - "문자열" - '문자열' - """문자열""" - .. Python/개념정리 2022. 10. 26. [ML] 4. DecisionTree(결정트리) 멋쟁이 사자처럼 AI스쿨 7기 오늘코드 박조은 강사님의 강의자료 및 강의 내용을 바탕으로 포스팅하였습니다. 사이킷 런 - user guide - 1. supervised learning - 10번: tree 계열 사이킷 런 - user guide - 1. supervised learning - 11번: boost tree 계열 1. 결정 트리 학습법(decision tree learning) 어떤 항목에 대한 관측값과 목표값을 연결시켜주는 예측 모델로 결정 트리를 사용하는 학습법 위에서 확인할 수 있듯이 스무고개를 하는 것처럼 질문을 이어가며 학습하는 구조이며, 특정 기준에 따라 데이터를 구분하는 모델이 바로 Decision Tree이다. 질문이나 정담을 담은 상자(위 사진 속 마름모나 타원)를 노드라고.. 머신러닝과 딥러닝/ML 개념정리 2022. 10. 26. [ML] 3. 머신러닝 파이프라인, 전체과정 멋쟁이 사자처럼 AI스쿨 오늘코드 박조은 강사님의 수업자료 및 수업내용을 바탕으로 포스팅하였습니다. 1. 머신러닝의 파이프라인 1️⃣ EDA - 기본 탐색: info, describe, histplot, 결측치, 이상치, 희소값 확인 등 2️⃣ Data Preprocessing(데이터 전처리) 3️⃣ Feature Engineering: 피쳐를 어떻게 유용하게 만들 것인가?, 도메인 지식을 기반으로 피쳐를 변형, 생성하는 것 - feauture selection(target에 중요한 영향을 미치는 feature를 어떻게 선택할 것인가?) - feature extraction(차원축소 등을 통해 새로운 중요 피쳐를 추출) - feature transform & Scaling(피쳐 스케일링, 피쳐 정규분포화.. 머신러닝과 딥러닝/ML 개념정리 2022. 10. 26. [ML] 2. 머신러닝의 주요 4가지 알고리즘 멋쟁이 사자처럼 AI스쿨 7기 오늘코드 박조은 강사님의 수업자료 및 내용을 바탕으로 포스팅하였습니다. 1. 머신러닝의 주요 4가지 알고리즘 1) 분류: 범주형, 지도학습 2) 회귀: 수치형, 지도학습 3) 군집화: 범주형, 비지도학습 4) 차원축소: 수치형, 비지도학습 지도학습과 비지도학습의 차이는 정답유무이다. 정답이란 레이블이 되어 있는가를 의미한다. 위 4가지 중에서도 핵심은 분류와 회귀이다. 2. 지도학습의 알고리즘(분류와 회귀) 1) 선형회귀 분류 X, 회귀 O 2) 정규화 분류 X, 회귀 O 3) 로지스틱 회귀 분류 O, 회귀 X 4) 서포터 벡터 머신(SVM) 분류 O, 회귀 O 5) 커널 기법 적용 서포터 벡터 머신 분류 O, 회귀 O 6) 나이브 베이즈 분류 분류 O, 회귀 X 7) 랜덤.. 머신러닝과 딥러닝/ML 개념정리 2022. 10. 26. [ML] 1. 머신러닝과 딥러닝, 지도학습과 비지도학습, EIL, 사이킷런, 딥러닝 라이브러리 종류 멋쟁이 사자처럼 AI스쿨 7기 오늘코드 박조은 강사님의 수업내용 및 자료를 바탕으로 포스팅하였습니다. 1. 머신러닝과 딥러닝 머신러닝이란? 인공지능의 연구 분야 중 하나로 기계학습이라고도 한다. 인간의 학습 능력과 같은 기능을 컴퓨터에서 실현하고자 하는 기술 및 기법 딥러닝이란? 기계학습(머신러닝)의 한 분야로 컴퓨터가 사람처럼 생각하고 배울 수 있도록 하는 기술 신경망학습 등을 주로 다룬다. 즉 머신러닝과 딥러닝의 차이는 신경망 사용 여부라고 할 수 있다. 2. 지도학습과 비지도 학습 지도학습? 정답이 있는 학습 비지도학습? 정답이 없는 학습 즉 지도학습과 비지도학습을 구분하는 가장 큰 기준은 정답 유무이다. 정답은 target, label이라고도 하며, Nan 혹은 Null이면 정답이 없는 것이다. .. 머신러닝과 딥러닝/ML 개념정리 2022. 10. 26. 이전 1 ··· 26 27 28 29 30 다음