간혹 주변에서 나도 공부해보고 싶은데 어떻게 시작해야 하냐는 질문을 받는다.
시작한지 9개월차…밖에 안되었지만 혹시 시작하고자하는 분들의 시행착오를 조금이나마 줄여주기 위해서
내가 했던 순서를 포스팅 해보려 한다.
정말로 처음 시작하는
의대생, 혹은 의사선생님들이 참고하시면 좋을 것 같다.
참고 : 프로그래밍 경험은 없었고, 수학&통계는 고등학교 이과과정 + 의대에서 배운 기초 의학통계학 정도의 베이스를 갖고 시작했다.
우선은 그래도 프로그래밍 문법을 조금은 알아야 뒤에 과정을 할 수 있다.
이 당시 R을 할까 파이썬을 할까 고민했었는데, 조금 더 범용적으로 쓰이는 파이썬을 선택했다.
전부다 외울 수는 없을 것 같고, ‘이런거구나~’ 수준으로 보고(이렇게 보면 일주일도 안걸린다.)
나중에 필요한 문법을 찾아 보는게 효율적일것 같다.
문자그대로 밑바닥부터 차근차근 시작하는 딥러닝이다. 파이썬 기반으로 차근차근 ‘딥러닝’이 뭔지를 알게 해준다.
입문으로 보기에 좋은 책.
(이것도 빨리보면 일주일도 안걸릴듯…)
홍콩과기대 김성훈 교수님의 명강의.
밑바닥부터 시작하는 딥러닝으로 딥러닝이 뭔지를 알았다면,
조금더 나아가서 Convolutional Neural Network(CNN), Recurrent Neural Network(RNN) 등 실제 쓰이는 테크닉을 배울 수 있다.
lec과 lab으로 구성되어 있는데, lab은 텐서플로 예전 버전으로 직접 코딩해보는 강의로, 생략해도 될 것 같다.
모두를 위한 딥러닝과 같이 봤다. 내용은 겹치지만 이 책이 더 넓다.
케라스라는 라이브러리를 만든 분이 직접 쓰신 책.
직접 케라스로 공개데이터를 돌려볼 수 있다.
이 책까지 보면 일반적으로 쓰이는 딥러닝 테크닉의 이해까지는 커버가 가능한 것 같다.
어느정도 이론적으로는 딥러닝을 이해하였지만, 실제 데이터를 다루는 것은 또 다른 얘기더라….
전처리에서 분석까지 모든 과정을 real data로 해 볼 계획이다.
(SIIM-ACR Pneumothorax dataset 사용 해 볼 계획)
딥러닝, 머신러닝 공부를 하다보니 결국 통계(혹은 수학)의 연장선상 이라는 생각을 하게 되었고,
그 기반에서 데이터사이언스를 이해하고 싶어서
공부를 시작하게 되었다.
통계학의 입문서. 생각보다 의대에서 배우는 의학통계랑 겹치는 부분이 많아서 금방 본다.
(연습문제 풀고 이럴 시간은 없었고, 개념위주로 봤습니다.)
선형대수학은 벡터와 벡터공간에 대한 학문이다.
우리는 복잡한 데이터를 고차원 벡터공간 위의 벡터로 바라볼 수 있고,
선형대수학에 쓰이는 이론과 직관으로 데이터를 바라볼 수 있다.
선형대수를 직관 위주로 설명한 책. 굉장히 평이 좋다.
선형대수를 재미있게 공부할 수 있다.
행렬식, 기저 등의 개념, 행렬의 단순계산만 배우는 것이 아니라
선대에 대한 직관을 기르는데 매우 도움이 된다.
위에 책이 직관위주라면 이 강의는 개념과 증명위주로 설명하였다.
위에 책과 같이 봤더니 꽤 괜찮았다.
선대직관을 기르는데 도움이 되는 유투브 강의.
심심할때 하나씩 들어보면 괜찮을 것 같다.
한글 자막도 있다.
통계를 수학적으로 엄밀하게 다루는 학문이라고 생각하면… 될것같다.
통계를 좀 깊게 이해해보고자 시작했다.
이 책은 난이도도 상당하고 양도 많기 때문에 각잡고 시작해야 한다.
미적분 내용 등, 고등학교 과정으로 커버가 되지 않는 부분도 좀 있지만,
그때그때 찾아보면서 하면 할 만하다. (아직까지는…)