본문 바로가기

STUDY/Python

(23)
[Operator] 산술 연산자 / 비교 연산자 / 연산자 모듈 이 글은 24.01.03에 본인 벨로그에 작성했던 글을 옮겨 온 것이다. 산술 연산자(나머지와 몫) divmod(a, b) a를 b로 나누었을 때의 몫과 나머지를 튜플형으로 반환하는 메서드. # 예시 # input a=10 b=3 print(divmod(a, b)) ==================== # output (3, 1) 비교 연산자(문자 비교) ord(x) => 문자를 아스키 코드로 변환(x는 길이 1의 str형 데이터) chr(y) => 아스키 코드를 문자로 변환(y는 int형 데이터) # 예시 # input print(f"'A' -> {ord('A')}") print(f"83 -> {chr(83)}") ============================== # output 'A' -> 65..
[Anaconda] 가상환경 생성/활성화/삭제/패키지 설치/아나콘다 명령어 지난 포스팅에서는 아나콘다에 대해 소개하고 설치도 해 보았다. [프로그래밍/Python] - [Anaconda] 아나콘다란? / 설치 / 명령어 소개 [Anaconda] 아나콘다란? / 설치 / 명령어 소개 이번 포스팅에서는 아나콘다가 뭔지 알아보고 직접 설치해볼 것이며 다음 포스팅에서는 아나콘다를 이용해 가상환경(요게 뭔지는 다음 포스팅을 기대해주시라)을 만들고 삭제하고 이것저것... k-wien1589.tistory.com 그리고 이는.. 파이썬 가상환경을 씹고 뜯고 맛보고 즐기기 위함이었다. 이번 포스팅에선 가상환경이 뭔지 그 개념과, 아나콘다로 생성도 해 보고 활성화도 해 보고 삭제도 해 보고 이것저것 다 해볼 것이다. 가상환경을 처음 접하시는 분들(본인 포함)을 위한 포스팅이다. Window 기..
[Anaconda] 아나콘다란? / 아나콘다 설치 이번 포스팅에서는 아나콘다가 뭔지 알아보고 직접 설치해볼 것이며 다음 포스팅에서는 아나콘다를 이용해 가상환경(요게 뭔지는 다음 포스팅을 기대해주시라)을 만들고 삭제하고 이것저것... 다 해 보고 아나콘다 명령어도 알아볼 것이다. 본 포스팅은 아나콘다가 뭔지 처음 접하시는 분들을 위한 것이다. Window 기반으로 진행된다. 아나콘다Anaconda 1. 아나콘다란 무엇인가? 당연히 뱀을 말하는 건 아니고, 머신러닝이나 데이터 분석 등에 사용하는 여러가지 패키지가 기본적으로 포함되어있는 파이썬 배포판이다. 2. 아나콘다를 왜 쓰는가? 공식 홈페이지에서 파이썬을 설치하면 패키지 관리자인 pip를 제외한 어떤 패키지도 추가로 설치되지 않는다. 그래서 파이썬만 사용한다면 사용자가 이것저것 필요한 것을 다 설치해야..
[visualization] 결측치 시각화 - missingno 보통 데이터 EDA를 할 때엔, 결측치가 있는지 없는지를 먼저 살펴보는것이 일반적이다. 이는 isna()나 isnull()을 통해 수치로 확인할 수 있지만 시각화도 해볼 수 있다. 어떻게 ? missingno라는 라이브러리의 matrix(), bar() 함를 이용한다. (포켓몬의 미싱노가 생각난다...) 간단하게 데이터를 만들고 직접 사용해보도록 하자. 1. 데이터 생성 2.1 matrix() 위의 df 출력결과와 비교해서 보면 알겠지만, 결측치는 흰색으로, 그 외는 검은색으로 표시되어 있다. 즉 컬럼별 결측치의 위치를 나타낸다. 2.2 bar() 각 결측치의 위치를 표시했던 matrix()와는 달리, 각 컬럼별로 결측치가 얼마나 있는지를 보여주고 있다. 데이터가 많다면, bar()의 파라미터에 log=..
[Pandas] concat()과 merge()의 차이 두 함수 모두, 여러개의 DataFrame(이하 df)을 하나로 합칠 때 사용하는, pandas에서 제공하는 함수다. 두 함수의 목적은 비슷해보일지 모르나, 중요한 차이점이 있다. 꼭 알고 사용하도록 하자. 1. concat([df1, df2, ...] axis) concat()은, 데이터프레임을 "합친다" 보다는 "이어 붙인다"에 좀 더 가깝다. 백문이 불여일견, 직접 보도록 하자. 아래와 같이, df1과 df2라는 2개의 데이터프레임이 있다. concat()을 사용해서 가로 방향으로 합쳐보자. ** axis 파라미터에는 1과 0이 들어갈 수 있다. 0은 행을 의미한다. 좀 더 자세히는, 행이 전개되는 방향, 즉 위/아래 방향(세로)을 의미한다. 1은 열을 의미한다. 좀 더 자세히는, 열이 전개되는 방..
[Pandas] describe() 특정 데이터(DataFrame)를 EDA 할 때에, 거의 반드시라고 해도 좋을 정도로 꼭 해주어야 하는 것 중 하나가 feature들의 기술통계량을 확인하는 것이다. 이 때, describe()을 사용한다. 바로 예시를 한번 보자. 아래와 같은 데이터가 있다. 9개의 컬럼을 가지며, 각 컬럼의 데이터 타입은 object, datetime, float, int형 등등이다. 그리고, 수치형 feature들의 데이터에 대해 평균값이 얼마일지, 최소값이나 최대값은 얼마일지 등등의 정보를 보고 싶다고 하자. 1. describe() 이럴 때 쓸 수 있는 것이 describe()다. 사용법은 간단하다. 이렇게 코드 한 줄로 간단하게 확인할 수 있다. 그러나 위에서도 확인할 수 있듯 기술통계량이기 때문에 기본적으로 ..
[Pandas] idxmax(), idxmin() idxmax()와 idxmin()은 행 별/열 별로 최대값/최소값의 인덱스(행 인덱스, 열 인덱스)를 반환하는 메서드다. idxmax(), idxmin()은 다음 파라미터들을 갖는다. - axis : 0 / 'index' or 1 / 'columns' (기본값 : 0) 0(행 방향) : 열(column)별 최대(최소)값의 행 인덱스 값 반환 1(열 방향) : 행(row)별 최대(최소)값의 열 인덱스 값 반환 - skipna : True or False (기본값 : True) True : 결측치는 고려하지 않는다. False : 결측치가 있으면 해당 행/열의 인덱스 대신 NaN을 출력한다. - numeric_only :True or False (기본값 : False) => int, float형 데이터만 출..
[데이터 과학을 위한 파이썬 프로그래밍_2판] 9. 파이썬 스타일 코드(2) 연습문제 풀이. 1. 아래 코드의 실행 결과는? a = [[1,2,3,5], [1,2,3,4]] b = [[40,40], [30,30], [20,20], [10,10]] print([[sum([t[0]*t[1] for t in zip(i,j)]) for j in zip(*b)] for i in a]) - 답 및 해설 # 입력 a = [[1,2,3,5], [1,2,3,4]] b = [[40,40], [30,30], [20,20], [10,10]] print([[sum([t[0]*t[1] for t in zip(i,j)]) for j in zip(*b)] for i in a]) # 출력 [[210, 210], [200, 200]] => zip() 함수는 같은 인덱스의 원소끼리 튜플로 묶는다. *(asteri..