전체 글
-
[Selenium] 진학어플라이 정시 경쟁률 정보 크롤링하기Python/크롤링 2025. 3. 26. 10:37
파이썬으로 진학어플라이 정시 경쟁률 정보 크롤링하기수능 및 입시 시즌이 되면, 많은 분들이 관심을 가지는 정보로 정시 경쟁률을 꼽아볼 수 있습니다. 그래서 수험생들이 경쟁률 정보를 모아 보여주는 진학어플라이 등의 웹사이트에서 대학별 경쟁률 정보를 찾아보는데, 이걸 한번에 모아서 다운로드하거나 자동으로 수집해서 다양한 기능을 위해 활용해볼 수 있겠습니다. 파이썬(Python)을 어느 정도 아는 분들은 셀레니움(selenium)을 활용해 크롤링하면 간편하게 해결할 수 있습니다. 크롤링 대상 살펴보기이번에 데이터를 수집할 대상은 진학사 스마트경쟁률입니다. 여기서는 대학별 입시 경쟁률을 올해 및 지난 연도별로 모아볼 수 있는데요, 저희가 이번에 이용할 데이터는 4년제, 2024년도, 정시 데이터입니다. ..
-
[Python] enumerate 함수 알아보기Python/파이썬 기초 2025. 3. 19. 11:12
enumerate 함수 알아보기파이썬(Python)에서 for 반복문을 시행할 때, 반복문은 반복 대상의 value를 반환해 줍니다. 예를 들어, ['a','b','c','d','e'] 라는 리스트를 반복의 대상으로 한다면 해당 반복문은 'a','b','c','d','e' 값을 차례대로 반환해 줍니다. 그런데, 반복을 할 때마다 몇 번째 반복문인지를 함께 알아둬야 할 때가 있습니다. 이 때는 두 가지 방법을 이용해볼 수 있는데요, 우선은 몇 번째 반복문인지 따로 기록하는 방법을 시도해 보겠습니다. # 방안 1: 몇 번째 반복문인지 따로 기록하기ind = 0sample_list = ['a','b','c','d','e']for sample in sample_list: ind += 1 print(..
-
[Python] 환경 변수(.env) 관리법 알아보기Python/파이썬 기초 2025. 3. 17. 14:10
파이썬의 환경 변수(.env) 관리법 알아보기프로그래밍을 할 때, API 키나 비밀번호 등의 보안 정보를 활용해야 할 때가 종종 있습니다. 그런데, 코드 안에 이런 정보를 대놓고 적어놓으면 보안상 좋지 않지요. 그래서, 환경 변수 파일인 .env 파일에 이런 정보를 밀어넣어두고, 필요할 때마다 불러오는 방법을 사용하는 것을 권장드립니다. 이번에는 파이썬(Python)에서 환경 변수를 관리하는 모듈인 dotenv를 활용해서 환경 변수를 관리하는 방법을 알아보겠습니다. .env 파일 정의하기우선, 환경 변수는 독립된 파일에 정의해 놓는 것이 중요합니다. 개발자들 사이에서 많이 활용되고 있는 형태는 .env 파일을 따로 만들어 두는 방식인데요, 이 파일은 파이썬에서 변수를 설정해 두듯이 다양한 정보를 정의하..
-
[Python] 주석 작성 및 타입 힌트 알아보기Python/파이썬 기초 2025. 3. 10. 17:28
파이썬의 주석 작성 알아보기프로그래밍을 할 때 가장 중요한 기술로 주석(annotation)을 빼놓을 수 없습니다. 주석은 프로그램 실행에는 전혀 영향을 주지 않지만, 코드를 읽거나 쓰는 사람들이 프로그램의 구조를 효과적으로 이해할 수 있도록 작성하는 메모입니다. 코드를 100% 이해할 수 있다면야 이론적으로 필요 없는게 주석이지만, 실제로는 베테랑 개발자들도 주석 없이는 이해할 수 없는 코드가 잔뜩 있기 때문에, 주석을 써놓는건 기본 중의 기본으로 교육되고 있지요. 이번에는 파이썬(Python)에서 사용되는 다양한 주석의 표현 방법에 대해서 알아보도록 하겠습니다. # 기호를 사용한 주석파이썬에서는 주석을 작성할 때 기본적으로 # 표기를 사용합니다. # 기호는 해당 기호 오른쪽에 있는 글자를 모두 주석..
-
[Python] 데코레이터와 어노테이션 알아보기Python/파이썬 기초 2025. 3. 10. 12:51
파이썬 데코레이터와 어노테이션 알아보기파이썬(Python)에서 코딩을 하다보면... 특히 객체지향 프로그래밍에 대해 공부할 때, 종종 함수 위에 @decorator 와 같은 표현을 사용하는 것을 볼 수 있습니다. 이건 어노테이션(annotation)이라는 표현 방법으로, 데코레이터(decorator)라고 하는 기능을 함수에 적용하는 문법입니다. 이렇게 설명하면 무슨 말인지 모를테니, 우선은 데코레이터와 어노테이션의 정의부터 알아보고 구현해 보도록 하겠습니다. 데코레이터는 기존에 정의된 함수가 있는 경우, 이를 바꾸지 않고도 새로운 기능을 추가할 수 있게 만드는 함수입니다. 기본이 되는 기능이 하나 있고, 이 기능을 다양한 위치에서 사용하면서 약간의 변경을 가하고 싶을때 유용한 기능입니다. 글로 설명하는 ..
-
[Bark] 딥러닝 TTS 모델 🐶Bark를 이용해 파이썬으로 말하는 AI 만들어보기Python/음성처리 2025. 3. 5. 09:15
딥러닝 TTS 모델 🐶Bark를 이용해 말하는 AI 만들어보기이 글은 깃허브의 suno-ai/bark 문서를 번역 및 재구성해 작성했습니다. 생성된 결과물 또한 해당 URL에서 들어볼 수 있습니다.흔히들 TTS라고 말하는 Text-to-Speech 모델이 있습니다. 이 모델은 글자로 적혀 있는 말은 사람이 말하는 것과 같이 음성 합성을 해 주는 모델인데요, 옛날에는 청각장애인을 위한 보조 기능에 머물러 있었지만 지금은 사용 범위가 확장되었습니다. 예를 들어, 화면이 없는 IoT 기기에서 음성 피드백을 주거나 AI 비서 서비스들의 상호작용에 이용되곤 하지요. 이번에는 파이썬(Python)을 이용해서, Suno AI에서 제공하는 오픈소스 딥러닝 TTS 모델인 🐶Bark를 이용해 보는 방법을 알아보겠습니다..
-
[urllib] 웹사이트 주소 규칙을 나타내는 URL 알아보기컴퓨터과학 2025. 2. 25. 16:45
웹사이트 주소 규칙을 나타내는 URL 알아보기이 글은 mdn web docs의 What is a URL? 문서를 참조하여 작성했습니다.우리가 흔히 사용하는 웹사이트는 URL(Uniform Resource Locator)이라고 하는 주소 형식을 사용합니다. URL은 웹에 게시된 리소스를 검색하기 위해 브라우저에서 사용하는 메커니즘을 이르는 말이예요. 이번에는 이 웹사이트 주소를 이용해 특정 웹페이지의 정보를 분석하거나, 파싱(parsing)을 해보려고 합니다. 만약 URL 파싱을 잘 한다면, 적절한 URL 입력을 통해서 크롤링(crawling) 등의 작업을 해결할 수 있습니다. 예를 들어, 네이버 지도에서 홍대 카페 라고 검색하고 싶다면 지도 웹사이트의 검색창을 누르고 홍대 카페를 적도록 하는 방법도 있지..
-
[BeautifunSoup] 파이썬으로 네이버페이 증권 종목토론실 데이터 크롤링하기 - 2Python/크롤링 2025. 2. 25. 09:54
네이버페이 증권 종목토론실 데이터 크롤링 - 2이전에 네이버페이 증권 종목토론실 데이터 크롤링 을 통해서 종목토론실 데이터를 판다스 데이터프레임(Pandas DataFrame) 형태로 받아오는 방법을 간단하게 알아보았습니다. 이 데이터를 그대로 사용해도 좋지만, 본문 데이터를 함께 사용하고 싶은 분들이라면 각 게시글의 URL 정보를 함께 크롤링하는게 좋습니다. 그래서, 이번에는 파이썬(Python)과 뷰티풀수프(BeautifulSoup)를 사용하는 것은 같지만, 게시글 URL 및 본문 데이터를 함께 크롤링할 수 있도록 코드를 변경해 보겠습니다. 데이터 크롤링이번에는 URL 정보를 받아오기 위해, html 문서의 a 태그 매개변수를 탐색해야 합니다. 그래서, pandas.read_html() 함수를 사용..