[공고] 무브가 머신러닝/딥러닝 개발자를 찾습니다
안녕하세요.
오르비를 운영하는 무브 주식회사가 Machine Learning / Deep Learning 에 관심있는 개발자 혹은 인턴을 구합니다.
최근 무브 주식회사는 인공지능, 머신러닝 분야에 많은 관심을 갖고 전사적으로 자원을 투입하고 있습니다.
아래 논문을 코드로 구현해주실 분을 찾습니다.
논문: Asynchronous Methods for Deep Reinforcement Learning
( https://arxiv.org/pdf/1602.01783.pdf )
A3C deep learning algorithm을 Atari 2600 (벽돌깨기) 게임에 적용한 논문입니다.
현재 TensorPack library 안에 이 논문에 나온 A3C가 구현이 되어있는데, 코드 의존성이 강해서 회사 프로젝트에 적용하는 데에 문제가 있습니다.
(TensorPack: https://github.com/ppwwyyxx/tensorpack )
참고자료:
Bottom-up Base코드가 있는 블로그 : https://medium.com/emergent-future/simple-reinforcement-learning-with-tensorflow-part-8-asynchronous-actor-critic-agents-a3c-c88f72a5e9f2#.73ups6rv6
논문에 나온 performance 정도의 코드를 재현해 주시거나 TensorPack 에서 의존성을 제거해서 A3C Module만 추출해 주시면 됩니다.
급여는 협의 후 결정 가능하고, 단기간 내에 구현해 주시면 MacBook 을 급여 외 추가 선물로 드립니다.
회사 홈페이지 : http://move.is
지원 E-Mail : dev+recruit@move.is
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.