pandas(2)
-
Day 13/14 - Pandas (2)
이번 글에서는 Series와 더불어 Pandas의 대표적인 자료형인 DataFrame에 대해 다룰 것이다. DataFrame은 엑셀이나 csv 자료형과 유사해서 이 둘을 생각하면 이해가 빠를 것이다. 다음은 DataFrame 생성 실습 중 헷갈리기 쉽거나 외워야 하는 부분만 캡쳐한 것이다. DataFrame의 속성을 알아보는데는 여러 메서드가 존재한다. 다만, Series와 마찬가지로 속성을 알아보는 함수에는 소괄호를 붙이지 않는다. 한 편 실습 중 위 사진의 메서드에 없는 것도 함께 실습했다. 또한 대부분의 데이터형들과 마찬가지로, DataFrame 역시 인덱싱과 슬라이싱이 가능하다. 방식은 Series 인덱싱 및 슬라이싱과 비슷하지만, DataFrame 인덱싱은 더 다양한 메서드를 갖추고 있다. 인덱..
2022.10.21 -
Day 12/13 - Pandas
이번 글에서는 파이썬의 라이브러리 중 하나이고, 데이터분석에 널리 쓰이는 Pandas의 기본적인 내용에 대해 정리할 것이다. Pandas의 경우 데이터분석에서 아주 큰 역할을 하는데, 이는 근본적으로 Pandas가 데이터 처리와 분석을 위해 만들어졌다는 점에서 기인한다. Pandas의 데이터타입에는 우선 Series가 있다. Series의 경우 여러가지 데이터타입을 사용할 수 있으며, 속성을 알아보는 함수가 소괄호를 붙이지 않는 점에 유의하자. 딕셔너리 자료형이 Series화 될 경우, key값이 인덱스로, value값이 실제 데이터로 자동으로 라벨링 된다는 것을 잘 기억하자. 한 편 Series 자료형의 경우 인덱스도 사용자가 지정하고 수정할 수 있고, 인덱스를 수정해도 기본 인덱스 번호는 여전히 사용..
2022.10.20