Python/개념정리8 [python] 11. 상대경로와 절대경로 파이썬 등에서 파일을 불러올 때 경로를 지정하게 되는데, 이 경로는 크게 상대경로와 절대경로로 구분할 수 있다. / 루트 (가장 최상의 디렉토리로 이동 / Web root) ./ 현재 위치 (파일의 현재 디렉토리를 의미) ../ 현재 위치의 상단 폴더 (상위 디렉토리로 이동) . : 현재 위치 / : 들어간다 상대경로 현재 경로를 기준으로 하는 경로 (현재경로에서 ./ 쓰는 것과 아무것도 안쓰는 것과 같은 위치를 나타냄) 예시) Q. 멋쟁이 사자처럼 본사 건물은 어디 있나요? A. 여기서 우회전하신 다음에 직진하세요. 절대경로 전체 경로를 다 지정하는 경로 윈도우 - c: 부터 시작하는 경로 예시) Q. 멋쟁이 사자처럼 본사 건물은 어디 있나요? A. 서울특별시 종로구 청진동 246 D1동 16층, 17.. Python/개념정리 2022. 11. 8. [Python] 9. 웹스크래핑 (3) - read_html(), trange, time.sleep() 1. read_html pandas에는 html을 불러올 수 있는 read_html 함수가 있다. url = "url" table = pd.read_html(url) table[0] read_html을 사용하면 매우 편하지만, table 태그가 있어야만 가져올 수 있고 table 태그에 가져오고자 하는 내용이 있음에도 접근 권한 등의 설정으로 가져오지 못하는 경우가 있다. 이런 경우에는 requests를 사용하여 가져오면 된다. requests는 다른 게시글로 자세하게 설명하도록 하겠다. 2. trange from tqdm import trange for문을 활용하여 웹 스크래핑을 할 경우 range 대신 trange를 사용하면 진행상황을 막대로 볼 수 있다. (그러나, range 대신이기 때문에 반복문.. Python/개념정리 2022. 10. 30. [Python] 7. 웹스크래핑(1) - 기본개념, 주의사항 1. 웹스크래핑과 웹크롤링 정보를 수집하기 위한 목적을 가진 두 방법론 1) 웹 크롤링(web crawling) - 자동화 봇(웹 크롤러)이 웹을 돌아다니면서 정보를 수집하는 것이다. - 크롤러란 조직적, 자동화된 방법으로 월드와이드 웹을 탐색하는 컴퓨터 프로그램이다. - 크롤링은 크롤러가 하는 작업을 부르는 말로, 여러 인터넷 사이트의 페이지(문서, html 등)를 수집해서 분류하는 것이다. - 대체로 찾아낸 데이터를 저장한 후 쉽게 찾을 수 있게 인덱싱하며, 인터넷 상의 사이트를 인덱싱하는 목적을 가지고 있다. 2) 웹 스크래핑(web scraping) - 원하는 특정한 정보를 웹에서 추출하는 것이다. - HTTP를 통해 웹 사이트의 내용을 긁어다 원하는 형태로 가공하는 것으로 크롤링도 스크래핑에 포.. Python/개념정리 2022. 10. 30. [Python] 5. EDA(2) - 직접구하기(수치형 데이터) 멋쟁이 사자처럼 AI스쿨 7기 박조은 강사님의 수업내용 및 자료를 바탕으로 포스팅하였습니다. 이전에는 추상화된 도구로 기술통계를 구하는 방법에 대해 배워보았다. 이번에는 도구를 사용하지 않고 직접 기술통계를 구하는 방법에 대해 배워볼 예정이다. (사용 라이브러리: pandas, numpy, seaborn, matplotlib) 추상화된 도구를 사용하면, 주로 확인하는 기술통계 값을 한꺼번에 확인할 수 있어서 간편하다. 그런데 왜 직접 기술통계를 구하는 것일까? 1. 대용량 데이터의 경우 추상화된 도구를 사용하기 어렵다. 2. 큰 용량의 데이터로 리포트를 출력하고자 할 때 시간이 오래걸린다. 즉, 추상화된 도구는 간편하기는 하지만 대용량의 데이터에는 부적절하며 직접 기술통계를 구할 경우에 보다 세밀하게 컨.. Python/개념정리 2022. 10. 26. [Python] 4. EDA(1) - pandas profiling, sweetviz, autoviz 멋쟁이 사자처럼 AI스쿨 7기 박조은 강사님의 수용내용 및 자료를 바탕으로 포스팅하였습니다. 추상화된 도구(pandas profiling, sweetviz, autoviz 등)로 기술통계를 간편하게 구하는 방법에 대해 배워볼 예정이다. 1. 수치형 변수와 범주형 변수 - 변수에는 수치형 변수와 범주형 변수가 있다. - 두 변수의 기술통계 값은 서로 다르다. - 일반적으로 seaborn을 활용하여 시각화를 할 경우, 범주형 데이터는 countplot을 수치형 데이터는 histogram을 사용한다. 2. 데이터셋 불러오기 데이터셋을 불러온 뒤에, 기본적으로 확인하면 좋을 사항들이다. 추가로 데이터 셋은 sns와 pd 라이브러리를 활용하여 불러올 수 있다. 데이터명 = sns.load_dataset("###".. Python/개념정리 2022. 10. 26. [Python] 3. 함수 지난 번에 파이썬 기초로 자료형, 제어문에 대해 배웠다. 이번에는 파이썬 함수에 대해 배워보자. 자료형 보러가기: 제어문 보러가기: 파이썬에서 함수는 우리가 익히 알고 있는, 수학에서 함수의 개념과 유사하다. ( y = f(x) ) 반복적으로 사용되는 가치 있는 부분을 함수로 만드는데, 어떤 입력값(x)을 주었을 때 어떤 결과값(y)을 돌려주는 식으로 함수 내부를 구성해야 한다. 함수를 만들어두면, 반복적으로 같은 내용을 수행해야할 경우 매우 유용할 것이다. 1. 기본구조 def 함수이름(인자): 내용 2. 매개변수 가. 매개변수(parameter) - def cal(c, b, a): 에서 c, b, a가 매개변수이다. 나. 실행인자(argument) - cal 함수 실행 시 입력하는 c, b, a의 값.. Python/개념정리 2022. 10. 26. [Python] 2. 제어문(조건문, 반복문) 멋쟁이 사자처럼 AI 스쿨 7기 박조은 강사님의 수업 내용 및 자료를 바탕으로 포스팅하였습니다. 지난 시간에 파이썬에서 사용하는 자료 형태에 대해 배워보았다. 이번에는 제어문(조건문, 반복문)에 대해 배워 볼 예정이다. 자료형 보러가기 1. 조건문(if) 가. 기본개념 - if: 조건 생성 - elif: 조건 추가 - else: 그 외 나. 기본구조 - 조건문 다음 콜론(:)과 들여쓰기(4칸)는 매우 중요하다. if 조건문: 수행할 문장 elif 조건문: 수행할 문장 ... else: 수행할 문장 다. in, not in, isin - x in 리스트, 튜플, 문자열 - x not in 리스트, 튜플, 문자열 - isin df.isin() 라. pass - 조건문에서 아무 일도 하지 않게 설정하고 싶지만.. Python/개념정리 2022. 10. 26. [Python] 1. 자료형 파이썬에서 사용하는 자료 형태에 대해서 배워보자. 1. 숫자형 가. 타입 - 정수(int), 실수(float), 복소수(complex) (※ 정수 ⊂ 실수 ⊂ 복소수) - type( ) : 객체의 자료형(타입) 확인하기 - int( ): 정수화 - float( ): 실수화 int(3.3) = 3 나. 사칙연산 너무나 당연하게도 파이썬에서는 사칙연산 기호를 활용하여 사칙연산을 할 수 있다. 사칙연산 🖊️ 몫과 나머지를 함께 구하고 싶다면? - divmod를 사용하면 된다. - divmod(5,2) = (2,1) - 위 처럼 (몫, 나머지) 튜플 형태로 값이 출력된다. 다. 연산자 관계연산자 대입연산자 2. 문자열 자료형 가. 문자열(string) 생성 - "문자열" - '문자열' - """문자열""" - .. Python/개념정리 2022. 10. 26. 이전 1 다음