본문 바로가기

반응형

인공지능

(49)
DRL 심층 강화학습 여정 안녕하세요 하얀손목시계입니다. 이번 년도 얼마 남지 않았네요..... 해야 할 일은 많은데 어떻게 해결해야 할지 모르고 앞으로의 대한 진로도 고민이 많았던 그런 2023년이었던 것 같습니다. 아마 이렇게 고민하고 열심히 노력하다 보면 언젠간 '이런 날도 있었지...'라고 생각하겠죠? 해서 오늘은 갑자기 생각이 들었던 프로젝트 및 공부를 시작한다고 말해볼 듯 싶습니다. 여러분은 DRL(심층 강화 학습)에 대해 알고 계신가요? DRL은 강화학습과 딥 러닝, 즉 강화학습과 뉴럴넷을 결합한 분야라고 생각하실 수 있는데요. 에이전트가 상태 공간을 수동으로 엔지니어링 하지 않고 구조화되지 않은 입력 데이터들로부터 결정을 내릴 수 있도록 하는 모델입니다. 저는 DRL의 성능은 다른 특정분야(이미지, 예측)에 주로 사..
Pandas 데이터 분석2(데이터 필터링) 2022.12.28 - [인공지능/데이터분석] - Pandas 데이터 분석1(데이터 불러오기) Pandas 데이터 분석1(데이터 불러오기) 오늘은 데이터 분석 관련해서 파이썬으로 어떻게 하는지 진행해볼려고 합니다. 개인적으로 주로 많이 쓰는 데이터 불러오기 방법에 관해서 따라하시면서 같이 진행해보시길 바랍니다. 판다스 startagainbornagain.tistory.com 파이썬 데이터 분석 제 2회차 입니다. 오늘은 데이터 필터링에 대해서 알아보도록 하겠습니다 보통 데이터 분석은 흔히 사람들이 사용하는 엑셀과 비슷하게 생각하시면 조금 더 이해하기 빠릅니다. 반대로 데이터 분석 하는 방법만 어느정도 알고 있다면 엑셀 공부하는게 쉽다고 느끼실 수 있습니다. 그럼 저번에 이어서 주식 데이터를 위주로 사용해..
스튜어드 러셀의 인공지능을 읽어보자(22) :논리적 에이전트1 https://startagainbornagain.tistory.com/130 스튜어드 러셀의 인공지능을 읽어보자(21) :제약 만족 문제1 https://startagainbornagain.tistory.com/127 스튜어드 러셀의 인공지능을 읽어보자(20) : 대항 검색7 https://startagainbornagain.tistory.com/126 스튜어드 러셀의 인공지능을 읽어보자(19) : 대항 검색6 https://startagainborn startagainbornagain.tistory.com 그외 내용들 모두 CSP에 대해서 자세히 설명하는 느낌이라 조금 더 자세히 다뤄보아야 할 것 같아서 다음 주에 한번 깊게 더 깊게 다뤄보도록 하겠습니다! 논리적 에이전트 이번 장에서는 복잡한 세계의..
Pandas 데이터 분석1(데이터 불러오기) 오늘은 데이터 분석 관련해서 파이썬으로 어떻게 하는지 진행해볼려고 합니다. 개인적으로 주로 많이 쓰는 데이터 불러오기 방법에 관해서 따라하시면서 같이 진행해보시길 바랍니다. 판다스는 어떤 기능이 있을까요? 자동적으로 혹은 명시적으로 축의 이름에 따라 데이터를 정렬할 수 있는 자료구조. 잘못 정렬된 데이터에 의한 일반적인 오류를 예방하고 다양한 소스에서 가져온 다양한 방식으로 색인되어 있는 데이터를 다룰 수 있는 기능 통합된 시계열 기능 시계열 데이터와 비시계열 데이터를 함께 다룰 수 있는 통합 자료 구조 산술연산과 한 축의 모든 값을 더하는 등의 데이터 축약연산은 축의 이름 같은 메타데이터로 전달될 수 있어야 함 SQL 같은 일반 데이터베이스처럼 데이터를 합치고 관계연산을 수행하는 기능 이런 기능들을 파..
Unity: 지능형 에이전트를 위한 일반 플랫폼_1 https://arxiv.org/pdf/1809.02627.pdf 오늘은 이 논문을 읽어보려고 합니다. 이 논문은 유니티 ml-agent를 개발하신 분들이 논문을 작성하신거 같아서 읽게되었습니다. 내용은 당연하게도 ml-agent에대한 내용입니다. ml-agent는 환경과 에이전트의 상호작용하기 좋은 환경인 게임 엔진으로 현실적이고 복잡한 시뮬레이션 환경을 제공하려고 노력해왔습니다. 목차 1에서는 소개이니 넘기도록 하겠습니다. 2. 환경 및 시뮬레이터 내부 이 세션에서는 환경과 시뮬레이터의 대해 설명해주고 있습니다 여기서 환경 및 시뮬레이터라는 것은 유니티 게임 엔진을 말하는 거 같습니다. 2.1 환경 속성 알고리즘이 점점 더 어려워지는 작업을 해결할 수 있는 환경의 복잡성 의미 있는 과제를 계속하려면 ..
제약 충족 문제(CSP - Constraint satisfaction problem) 제약 충족 문제 또는 제약 만족 문제라고 불리는 CSP는 상태가 여러 제약 조건이나 제한 사항을 충족해야 하는 개체 집합으로 정의된 수학적 질문입니다. CSP는 제약 만족 방법으로 해결되는 변수에 대한 유한 제약 조건의 동종 모음으로 문제의 개체(Entity)를 나타냅니다. CSP는 인공지능과 운영 연구(Operations Research)에서 주로 연구되고 있습니다. 이 문제는 규칙성은 겉보기에 관련이 없어 보이는 많은 집합의 문제를 분석하고 해결하기 위한 공통 기반을 제공합니다. CSP는 높은 복잡성을 나타내는데, 합리적인 시간 내에 해결하기 위해 휴리스틱 및 조합 검색 방법이 필요합니다. 그래서 나온 제약 프로그래밍 (CP)은 특히 이러한 종류의 문제를 해결하는 데 중점을 둔 연구 분야입니다. 제약..
스튜어드 러셀의 인공지능을 읽어보자(21) :제약 만족 문제1 https://startagainbornagain.tistory.com/127 스튜어드 러셀의 인공지능을 읽어보자(20) : 대항 검색7 https://startagainbornagain.tistory.com/126 스튜어드 러셀의 인공지능을 읽어보자(19) : 대항 검색6 https://startagainbornagain.tistory.com/122 스튜어드 러셀의 인공지능을 읽어보자(15) : 대항 검색5 http.. startagainbornagain.tistory.com 제약 만족 문제 저번에는 상태들의 공간을 검색해서 문제를 풀 수 있다는 착안을 살펴보았습니다. 그런 상태들 특정 영역에 국한된 발견법적 함수로 평가하고, 해당 상태가 목표 상태와 부합하는지 판정하면서 상태 공간을 검색합니다. 그런..
스튜어드 러셀의 인공지능을 읽어보자(20) : 대항 검색7 https://startagainbornagain.tistory.com/126 스튜어드 러셀의 인공지능을 읽어보자(19) : 대항 검색6 https://startagainbornagain.tistory.com/122 스튜어드 러셀의 인공지능을 읽어보자(15) : 대항 검색5 https://startagainbornagain.tistory.com/116 스튜어드 러셀의 인공지능을 읽어보자(15) : 대항 검색4 http.. startagainbornagain.tistory.com 확률론적 게임 실생활에서는 예측할 수 없는 여러 외부 사건들 때문에 의외의 상황에 처하기도 합니다. 여러 게임들은 주사위 굴림 같은 무작위 요소를 도입해서 이러한 예측 불가능성을 반영합니다. 그런 게임을 확률론적 게임(stocha..

반응형