Python/기계학습
-
[scikit-learn] 파이썬 Gradient Boosting 모델로 유방암 진단 기계학습 모델 만들기Python/기계학습 2023. 6. 14. 08:42
Gradient Boosting 모델로 유방암 진단 기계학습 시스템 만들기 기계학습(Machine Learning, ML)이 활용되는 분야 중 대표적인 것을 꼽자면 의료 분야를 빼놓을 수 없습니다. 실제로 많은 기계학습 알고리즘이 진단 보조, 환자 응급도 분류 등에 이용되고 있는데요, 이번에는 그런 활용 중 기초적인 기술을 한번 살펴보도록 하겠습니다. 파이썬(Python)을 이용한다면, 유방암 조직 사진을 분석해서 암이 있는지 진단할 수 있는 모델을 만들 수 있습니다. 이런 작업은 원래 의사가 하지만, 의사도 사람인지라 사람이 일으키는 오기재 등의 문제(Human Error)를 피해갈 수 없습니다. 이런 한계를 뛰어넘기 위해 개발자들이 암 진단 모델을 개발하고 있는데요, 현재 가장 뛰어난 분류 모델은 실..
-
[scikit-learn] RandomForest Classifier 기계학습 모델로 유전자 발현 분류하기Python/기계학습 2023. 5. 2. 09:05
RandomForest Classifier 기계학습 모델로 유전자 발현 분류하기 파이썬(Python)을 이용한 기계학습(Machine Learning, ML)은 다양한 분야에서 사용되고 있는데, 특히 생물정보학(Bioinformatics, BI)에서는 유전자를 이용한 연구에 많이 사용되고 있습니다. 그래서, 이번에는 BI 분야에서 흔히 사용하는 유전자(여기서는 RNA) 발현 분류를 테마로 잡아 기계학습 실습을 해 보겠습니다. 여기에서 사용할 모델은 랜덤포레스트 분류기(RandomForest Classifier, RFC) 라는 모델인데, 다양한 의사결정나무(DicisionTree, DT)를 여러개 만들어둔 다음 평균 예측을 통해 분류를 하는 지도학습 모델입니다. 이 분석에 사용한 데이터는 아래 정보를 참고..