모두 보기

    04. 산술 연산(연산 메소드)

    Python version : 3.7.10 Pandas version : 1.1.5 시리즈 연산 1. 시리즈와 숫자 만약 시리즈 객체에 어떤 숫자를 더하면 시리즈의 개별 원소에 각각 숫자를 더하고 계산한 결과를 시리즈 객체로 반환합니다. student1 = pd.Series({ '국어' : 100, '영어' : 80, '수학' : 90 }) percentage = student1/200 print(percentage)시리즈와 숫자 간의 사칙연산은 굉장히 간단하고 직관적인 방법으로 연산이 가능합니다. type()메소드를 활용하여 print(type(percentage)) 연산이 끝난 값도 시리즈 객체임을 알 수 있습니다. 2. 시리즈와 시리즈(연산 메소드 add(..

    03. 인덱스 활용( set_index(), reindex(), reset_index(), sort_index() )

    Python version : 3.7.10 Pandas version : 1.1.5 특정 열을 행 인덱스로 설정(set_index()) set_index() 메소드를 사용하여 데이터 프레임의 특정 열을 행 인덱스로 설정할 수 있습니다. 원본 객체를 바꾸지 않고 새로운 객체를 반환하는 점에 유의합시다. 만약 원래 객체를 변경하고 싶다면 옵션을 통해 설정이 가능합니다. exam_data = { '이름' : ['서준', '예린', '지은'], '수학' : [90, 80, 70], '영어' : [95, 89, 90], '음악' : [95, 80, 100], '체육' : [100, 90, 90] } ..

    02. 자료구조 - 데이터프레임(Data Frame)

    Python version : 3.7.10 Pandas version : 1.1.5 데이터 프레임(Data Frame) Data Frame은 R의 데이터프레임에서 유래했다고 알려져 있습니다. 엑셀, 관계형 데이터베이스 등 분야에서 사용되는 2차원 배열 구조입니다. 데이터 프레임의 행은 가로 줄, 열은 세로 줄을 의미합니다. 데이터 프레임의 열은 각각 시리즈 객체입니다. 시리즈를 열 벡터(column vector)라고 하면 데이터프레임은 2차원 벡터 또는 행렬(matrix)입니다. 열은 공통 속성을 갖는 데이터 행은 개별 관측 대상에 대한 속성 데이터들의 모음인 레코드가 됩니다. 또한 데이터 프레임을 만들기 위해서는 같은 길이의 1차원 배열(시리즈)이 여러 개 필요합니다. 데이터 프레임 만들기 1. 딕셔너..

    01. 자료구조 - 시리즈

    Python version : 3.7.10 Pandas version : 1.1.5 시리즈의 구조 시리즈는 데이터가 순차적으로 나열된 1차원 배열의 형태를 갖습니다. index와 value로 일대일 대응 됩니다. '{k:v}' 형태로 짝을 이루는 파이썬의 딕셔너리와 비슷한 구조를 갖습니다. 시리즈 만들기 1. 딕셔너리 이용하기 딕셔너리와 시리즈의 구조가 비슷하기 때문에 딕셔너리를 시리즈로 변환하는 방법을 많이 사용합니다. 아래와 같은 방법으로 딕셔너리를 시리즈 객체로 바꿀 수 있습니다. import pandas as pd dict_data = {"ab" : "1", "bc" : 2, "cd" : 3} sr_dict = pd.Series(dict_data) print(dict_data) pr..

    00. 판다스 시작하기

    1. 개발환경 구글 코랩을 이용하여 개발을 진행합니다. 코랩은 구글 서버로 운영하는 주피터 노트북이라고 할 수 있습니다. 코랩의 장점은 개발에 사용하는 컴퓨터에 GPU가 설치되어 있지 않아도 구글 서버의 GPU를 이용하여 코드를 실행 가능 하다는 것입니다. 또한 구글 드라이브와 연동해 백업, 협업 등이 매우 편리하다는 장점이 있습니다. !pip install pandas import pandas as pd 위 코드를 이용하여 코랩에서 판다스를 다운 받고, import 할 수 있습니다.