Python
-
KIND 공시 데이터로 교육서비스업 상장법인 정보 알아보기: 파이썬 크롤링 정리Python/크롤링 2026. 1. 20. 16:15
요약KIND 데이터를 활용하면 서울특별시에 소재한 교육 서비스업 상장법인 목록과 주요 정보를 정형화된 방식으로 수집할 수 있습니다. 이 글에서는 Selenium(셀레니움)과 BeautifulSoup(뷰티풀수프), pandas(판다스)를 이용해서 해당 데이터를 크롤링하는 과정을 차례대로 정리합니다.상장법인 목록을 조회하려면재무 분석이나 산업 분석을 하다 보면 특정 조건을 만족하는 상장법인 목록이 필요한 순간이 찾아옵니다. 예를 들어, 저는 최근에 서울특별시 소재 교육 서비스업 상장사만 따로 정리할 일이 있었습니다. 한국거래소 KIND 사이트에는 필요한 정보가 모두 있지만, 엑셀 파일 일괄 다운로드를 하면 회사명, 시장구분, 종목코드, 업종, 주요제품, 상장일, 결산월, 대표자명, 홈페이지, 지역 데이터만 ..
-
눈에 보이지 않는 1mm의 결함까지 AI는 어떻게 찾아낼까 (YOLO-SSW)Python/시각화, 이미지 2026. 1. 15. 14:35
요약정밀한 인쇄물 불량 탐지를 위해 고해상도 정보를 보존하고 효율적인 연산을 돕는 YOLO-SSW 모델 논물을 읽어보며, 모델의 핵심 기술과 실제 산업 현장 적용 가능성을 살펴봅니다. 제품을 생산하는 과정에서 품질 관리는 기업의 신뢰도와 직결되는 핵심 요소입니다. 특히 1mm도 되지 않는 미세한 흠집이 치명적인 오류로 이어지는 인쇄 회로 기판(PCB)이나 고품질 인쇄 공정은 검수 난이도가 매우 높습니다. 숙련된 작업자라 하더라도 장시간 반복되는 육안 검사에서는 피로도로 인해 실수를 할 가능성이 존재합니다. 이러한 배경에서 최근 학계와 산업계는 YOLO-SSW와 같은 고도화된 탐지 모델을 통해 검수 공정의 안정성을 확보하려는 노력을 기울이고 있습니다.미세 불량 탐지가 유독 까다로운 이유기존의 인공지능 모델..
-
리커트 척도를 이용한 설문 시각화하는 파이썬 코드 알아보기 (plot_likert)Python/시각화, 이미지 2026. 1. 13. 15:10
리커트 척도를 이용한 설문 시각화하는 파이썬 코드 알아보기 (plot_likert)요약리커트 척도로 작성된 설문 데이터를 파이썬으로 시각화하려면 어려운 점이 많습니다. 주요 시각화 패키지에서는 리커트 척도 데이터를 인식하는 기능이 없기 때문이지요. 그래서 이번에는 파이썬에서 리커트 척도 데이터를 별도 변환 없이 시각화할 수 있는 plot_likert를 알아보도록 하겠습니다. 전체 코드를 예제와 함께 설명드릴 예정이니, 이 코드를 참조해서 강의평가나 만족도 조사 결과를 퍼센트 기반 그래프로 깔끔하게 표현해 보도록 합시다. 설문 데이터 시각화는 막대 그래프가 어울리지 않는 이유 강의평가나 만족도 조사를 진행하면 대부분 엑셀이나 CSV 형태로 설문 결과가 쌓인다. 여기까지는 괜찮은데, 이를 파이썬으로 시각화하..
-
누끼 따는 사이트 대신 파이썬으로 이미지 배경 제거해보기Python/시각화, 이미지 2025. 8. 14. 15:21
누끼 따는 사이트 대신 파이썬으로 이미지 배경 제거해보기흔히들 누끼따기라고 부르는 작업이 있습니다. 이미지가 있을 때 이미지의 배경을 제거하는 것인데요, 요즘에는 AI 모델이 잘 만들어져서 그런지 누끼 따는 사이트들이 많이 운영되고 있더라고요. 그런데, 이런 서비스들은 유료이거나 기능의 제약이 있는 경우가 많아서 전문적인 작업에 활용하거나 대량 처리를 하기는 불편합니다. 그래서 이번에는 누끼 따는 사이트 대신 파이썬으로 이미지 배경 제거하는 프로그램을 만들어 보도록 하겠습니다. 패키지 설치이미지 배경 제거는 rembg 라고 하는 패키지에서 제공하는 remove 기능을 이용하는것만으로도 가능합니다. MIT 라이선스로 제공되는 패키지이기 때문에 특별한 제약 없이 상업적으로도 활용 가능하고, 이용료나 해상도..
-
웹 검색 기능이 탑재된 챗봇 구현해보기 (chatGPT API)Python/자연어처리 2025. 7. 30. 16:54
웹 검색 기능이 탑재된 챗봇 구현해보기 (chatGPT API)나만의 챗봇을 만들 때 흔히 이용하는 기술 중 하나가 RAG입니다. RAG는 단순히 외부 문서를 참조하는것 이외에도, 웹사이트 정보를 크롤링한 다음 참조하는 방식으로 웹 검색과 유사한 기능을 구현할 수 있어요. 이번에는 이런 설계를 활용해서 chatGPT API와 🦜️🔗랭체인(Langchain)을 이용해서 웹 검색 기능이 탑재된 챗봇을 구현해 보도록 하겠습니다. 이 프로그램을 만들기 전에는 랭체인을 설치하고 OpenAI API 키 발급을 해 놓는 정도의 준비만 해 두시면 됩니다. 웹 검색 기능 설계하기웹 검색 기능을 구현하기 위해서는 크게 두 가지 접근 방법을 고민할 수 있습니다. 제작 목적 및 편의성, 예산에 따라 알맞은 방법을 선택해..
-
프롬프트 인젝션 공격에 대해 알아보기Python/자연어처리 2025. 7. 29. 16:49
프롬프트 인젝션 공격에 대해 알아보기최근 LLM 모델을 활용한 서비스가 많아지면서, 모델의 허점을 공격하는 사례 또한 많아지고 있습니다. 이중에서 가장 피해 사례가 많고, 손쉽게 공격할 수 있는 방법으로는 프롬프트 인젝션(Prompt Injection)을 꼽을 수 있지요. 프롬프트 인젝션은 LLM 모델의 입력 데이터를 교란해서 의도치 않은 응답을 이끌어내는 공격 방식입니다. 아래에는 프롬프트 인젝션 공격의 유형과 이를 막을 수 있는 간단한 예제를 살펴보도록 하겠습니다. 챗GPT API를 활용한 코드 예시를 작성했으니 LLM 관련 서비스를 기획할 때 테스트 케이스 작성에 활용해 보세요. 프롬프트의 구조 이용하기LLM 모델에서는 프롬프트를 크게 두 종류로 나누어 관리합니다. 시스템 프롬프트(System P..
-
chatGPT가 거짓말 못하게 하는 방법, RAG에 대해 알아보기Python/자연어처리 2025. 7. 24. 11:36
chatGPT가 거짓말 못하게 하는 방법, RAG에 대해 알아보기검색 증강 생성이라고도 불리는 RAG(Retrieval-Augmented Generation)라는 기술이 있습니다. 이 기술은 대규모 언어 모델(LLM)을 사용할 때, 신뢰할 수 있는 외부 데이터를 참조해서 답변할 수 있도록 출력을 최적화하는 기술이예요. 간단하게 설명하자면, chatGPT 등의 챗봇이 거짓말을 하는 환각 현상을 효과적으로 해결할 수 있는 기술이지요. 이번에는 chatGPT와 같은 모델을 이용하기 위해 OpenAI API를 활용해서 내가 원하는 문서를 참조해 답변할 수 있는 나만의 챗봇을 만들어 보도록 하겠습니다. 기술스택 알아보기이번 실습에서는 API 활용 및 RAG를 구현할건데요, 이를 위해서 🦜️🔗랭체인(Langc..
-
파이썬으로 RData 파일 변환하는 방법 알아보기 (python rdata)Python/파이썬 기초 2025. 6. 22. 00:39
파이썬으로 RData 파일을 변환하는 방법 알아보기데이터 분석을 하다 보면 R 언어로 생성된 .RData 파일을 접하게 될 때가 있습니다. R에서는 이 포맷이 매우 일반적이지만, 파이썬(Python) 사용자에게는 다소 낯설 수 있습니다. 특히 요즘에는 R을 사용하던 사람들도 파이썬으로 옮겨가는 추세라, 데이터 이전을 위해서 .RData 파일을 파이썬으로 열어야 할 때도 있지요. 이번에는 파이썬으로 .RData 파일을 읽어들이고, 이를 엑셀 파일로 저장하는 방법을 정리해드릴게요. RData 파일이란.RData는 R 언어에서 사용되는 이진 데이터 저장 포맷 입니다. 하나 이상의 R 객체를 담을 수 있으며, 여기에 들어갈 수 있는 형태는 흔히 데이터프레임이나, 리스트, 배열 데이터 등이지요. 다만 파이썬에서..