Python(58)
-
Day 10 - Numpy
이번 글에서는 파이썬의 라이브러리 중 데이터 분석에 많이 쓰이는 넘파이에 대해 정리할 것이다. 카카오 사태 이후 티스토리에 글 쓰는 방법을 알아서 이 글부터는 다시 바로 블로그에 작성해서 업로드하게 된다. Numpy는 파이썬에서의 데이터 분석에서 함수 및 벡터 연산에 대한 다양한 함수를 제공하며, 배열(array) 형태의 데이터 타입을 통해 보다 빠른 연산을 수행 가능하게 한다. 특히 numpy의 배열에는 다양한 속성들이 있다. 해당 속성들은 데이터의 구조(행, 열, 차원), 차원, 데이터 타입, 데이터 개수(행 * 열 * 차원) 등으로 이루어져 있다. 또한 배열의 데이터 타입을 바꾼다거나, 배열의 데이터 구조를 바꾸는 함수도 존재한다. 리스트를 배열 타입으로 변화한 후, 각 속성들을 직접 알아보았다. ..
2022.10.18 -
Day 10 - 파이썬의 클래스 (4)
이번 글에서는 파이썬의 클래스 관련 항목 중 오버라이딩에 대해 다룰 것이다. 오버라이딩은 재정의를 의미한다. 여전히 티스토리에 글이 써지지 않아서 이 글은 MS Word로 작성한 뒤 이후에 티스토리로 옮긴 것임을 밝혀둔다. Airplane과 SupersonicAirplane 클래스를 통해 오버라이딩을 실습했다.
2022.10.18 -
Day 9 - 파이썬의 클래스 (3)
이번 글에서는 클래스의 상속에 관해 정리할 것이다. 상속이란 부모 클래스의 정보를 활용해 자식 클래스를 이끌어내는 것으로, 자식 클래스는 부모 클래스가 가진 정보(변수, 메서드 등)를 받는다. 부모 클래스와 자식 클래스를 생성하여 실제 오브젝트를 생성해 보았다. 부모 클래스와 자식 클래스, 그리고 각 변수와 객체를 불러올 때 할당되는 메모리 구조에 대한 이해가 필요하다. SalaryMan 자식 클래스를 하나 더 만들어서 실습해보았다.
2022.10.18 -
Day 9 - 파이썬의 클래스 (2)
지난 글에 이어 이번 글에서도 파이썬의 클래스에 대해 정리할 것이다. 카카오 데이터센터 사태로 티스토리에 글 쓰기가 되지 않아서(…) 본문은 MS Word에 작성한 후 붙여넣기 한 것임을 미리 밝힌다. 파이썬의 클래스 내부에서 특정 클래스 전용으로 사용하는 함수를 메서드라고 하는데, 이 메서드에는 지난 글에서도 언급한 것처럼 self 키워드를 일반적으로 사용한다. 이에 대해 좀 더 자세히 배웠는데, 결론은 원래 이해했던 것처럼 self 키워드를 통해 해당 인스턴스가 클래스 내부의 것임을 나타내기 위해 self를 사용한다는 것이다. 다만 (self, 변수)의 형식으로 다른 변수가 입력될 수도 있다. 결국, self란 클래스 내부의 오브젝트와 같은 주소를 참조한다는 뜻의 키워드임을 알아두자. 이후에 클래스의..
2022.10.18 -
Day 8 - 파이썬의 클래스
이번 글에서는 파이썬의 클래스에 대해 다룰 것이다. 클래스에 대해 이해하기 더 쉽게 하기 위해서는 구조체에 대한 설명이 우선 필요하다. 구조체란 인덱스가 아닌 "변수명"으로 특정 데이터를 묘사하기 위해 사용한다. 인덱스 번호보다는 변수명을 통해 데이터를 묘사하는 것이 더 이해하기 편리하고 여러 사용자가 함께 이용하기 쉽기 때문이다. 이렇게 구조체를 만들기 위해서는 묘사하고 싶은 대상에 대한 데이터를 추상화하는 작업이 반드시 필요한데, 그 이유는 특정 대상에 대한 데이터의 양이 방대하고, 따라서 구현하고 싶은 기능에 맞추어 데이터를 정의하고 선별하는 것이 더 효율적이기 때문이다. 이러한 구조체를 파이썬에서 구현하는 방법이 클래스이다. 또한 클래스를 만드는데 익숙해지기 위해 실습을 해보았다. 한 편, 클래스..
2022.10.14 -
Day 8 - 크롤링(3)
이번 글에서는 우선 알라딘의 원페이지 및 순회 크롤링 실습을 정리하고, browserless 크롤링에 대해 다룰 것이다. 우선 알라딘 사이트에서 베스트셀러 목록의 원페이지 크롤링을 실습한 것이다. div태그로 설정되어 있는 책 한 권마다의 block에서, li태그로 설정되어 있는 것 중 작가 목록만 가져오는 과정이 어려웠다. 다행히 몇 번 오류와 수정을 통해 수행할 수 있었다. 원페이지 크롤링을 토대로 알라딘의 주간 베스트셀러 전체 목록에 대한 순회 크롤링 역시 수행했다. 각 block마다 li태그로 설정되어 있는 순서가 달라서, 작가 목록만 가져오는 과정이 복잡했고, if문으로 일단 해결했지만 다른 효율적인 방법을 찾아봐야겠다는 생각을 했다. 그 이후 requests 라이브러리를 이용한 browserl..
2022.10.14