본문 바로가기

반응형

인공지능/프로젝트

(3)
DRL 심층 강화학습 여정 안녕하세요 하얀손목시계입니다. 이번 년도 얼마 남지 않았네요..... 해야 할 일은 많은데 어떻게 해결해야 할지 모르고 앞으로의 대한 진로도 고민이 많았던 그런 2023년이었던 것 같습니다. 아마 이렇게 고민하고 열심히 노력하다 보면 언젠간 '이런 날도 있었지...'라고 생각하겠죠? 해서 오늘은 갑자기 생각이 들었던 프로젝트 및 공부를 시작한다고 말해볼 듯 싶습니다. 여러분은 DRL(심층 강화 학습)에 대해 알고 계신가요? DRL은 강화학습과 딥 러닝, 즉 강화학습과 뉴럴넷을 결합한 분야라고 생각하실 수 있는데요. 에이전트가 상태 공간을 수동으로 엔지니어링 하지 않고 구조화되지 않은 입력 데이터들로부터 결정을 내릴 수 있도록 하는 모델입니다. 저는 DRL의 성능은 다른 특정분야(이미지, 예측)에 주로 사..
강화학습을 해보자~!(2) 자 우리는 흔히 많이 쓰는 강화학습의 DQN(Deep Q network)라는 것을 사용해보려고 한다. 이 프로젝트는 유튜브 팡요랩을 검색하시면 우리가 이 프로젝트를 하면서 보는 참고서라고 생각해주면 편할 것 같다. 여기 강화 학습 같은 경우 흔히 표현을 할 때 줄기와 잎을 많이 표현한다. 왜 잎과 줄기(가지)로 표현하는지 알아 보도록 하자 다시 한 번 강요해서 말하지만 기본적으로 테트리스로 시작할 것이며 맨 처음은 강화 학습을 공부하고 연구하는 것이기에 유튜브 팡요랩에서 올라온 영상들로 이론 설명과 실제 예제들을 하나 하나씩 할 것이며 이 이론 공부를 다 끝내면 이제 우리 프로젝트를 하나 하나씩 진행 할 것이다. 아마 우리는 맨 처음 스타크래프트2 API를 사용해서 강화학습 AI를 한 번 사용해 볼 것이..
강화학습을 해보자~!(1) 여러분은 인공지능을 얼마나 아시고 계시는가? 인공지능은 일반 가정(빅스비, siri, 등) 이렇게 가까운 것부터 멀리로는 알파고까지 다양하게 우리 생활부터 우리 미래까지 책임지고 있는 현재 인공지능은 AI개발자나 연구원이 되고 싶은 나에게 최적의 환경인 것 같다. 그렇기에 누구보다 뒤늦기 싫고 누구보다 빠르게 남들보다 멀리 나가고 싶기에 팡요 랩의 강화 학습 영상을 보고 따라 해 볼 예정이고 당연히 블로그를 만들었으니 이 한 번으로 끝나지 않고 제대로 한 번 논문을 읽으면서 해볼 것이다. 먼저 인공지능의 기준은 무엇일까? 인공지능은 영어로 Artifcial Intelligence로 간단히 말하면 인위적인 지능 즉 사람이 만들어 놓은 지능이다. 그렇다면 지능이란 무엇인가? 지능은 도전적인 새로운 과제를 성..

반응형