골드만삭스가 내놓은 인공지능 보고서

1.
요즘 뜨거운 화두가 인공지능입니다.인공지능을 기반으로 한 컴퓨팅을 인지컴퓨팅(Cognitive Computing)이라고 합니다. 인지컴퓨팅은 인지과학과 정보기술의 융합으로 이해할 수 있습니다.

인지컴퓨팅(cognitive computing)은 사람의 인지 능력을 모사하는 정보처리기술이다. 사람의 인지 기능은 지각, 행동, 언어, 시각, 기억, 학습, 추론, 의사결정 등을 포함하며 따라서 인지컴퓨팅은 환경 인식과 행동, 시각 및 언어 처리 능력, 연상 기억, 유연한 학습과 추론, 안정적인 의사결정 등을 수행하는 정보처리기술로 정의될 수 있다.인지정보기술은 인지과학(cognitive science)과 정보기술(information technology)의 융합기술로서 인지정보시스템(cognitive information systems)을 다룬다. 인지정보시스템은 사람이나 동물과 같은 자연계, 로봇과 컴퓨터와 같은 인공물을 모두 포함한다. 사람의 인지정보처리 원리를 기반으로 인지정보처리 기계를 창조하거나, 반대로 정보기술을 이용하여 사람의 인지정보처리체계를 탐구할 수도 있다. 전자는 컴퓨터공학과 인공지능 연구의 주 관심사이며 후자는 주로 인지과학이나 계산신경과학 연구의 영역에 속한다. 인지컴퓨팅은 전자에 속하는 기술이다. 그러나 후자의 기초 연구를 위한 새로운 중요한 도구 역할을 한다.전통적인 정보시스템과 달리 인지정보시스템은 센서로 환경을 지각하고 환경에 대해서 행동하며 환경과 상호작용한다는 점에서 차이가 있다. 따라서 환경으로부터 분리되어 부호화된 독립적인 정보를 처리하는 데에 초점을 맞춘 기존의 컴퓨팅과는 달리, 인지컴퓨팅은 환경과 일체를 이루는 살아있는 동적인 시스템으로서의 인지정보시스템에서의 컴퓨팅을 다룬다.다시 한번 요약하여 설명하자면, 인지정보시스템은 다음과 같은 특성을 갖는다.

∙환경과 상호작용하는 열린 시스템(openendedness)
∙다양한 센서로 환경을 지각(perception)
∙환경에 영향을 주는 행동을 생성(action)

이러한 특성으로 인해서 인지정보시스템은 다음과 같은 새로운 컴퓨팅 능력 즉 인지컴퓨팅 능력을 필요로 한다.

∙실시간 동적 정보처리 능력(dynamics)
∙다양한 센서데이터 통합 능력(integration)
∙순차적 행동패턴 생성 능력(generation)
Cognitive Computing I: Multisensory Perceptual Intelligence -실세계 지각행동 지능

인공지능과 인지컴퓨팅이 같지 않지만 밀접히 연결되어 있는 개념임을 알 수 있습니다. 인공지능을 화두로 이야기할 때 많은 이들이 관심을 갖는 부분은 ‘알고리즘’입니다. 지난 몇 년동안 기술적 화두를 되돌아 보면 인공지능을 HPC, 빅데이타, 클라우드와 같은 기술적인 변화위에서 급격히 화두가 되었다고 생각합니다. 골드만 삭스가 분석한 AI의 배경중 첫째도 데이타입니다.

Data. There has been massive growth in the amount of unstructured data being created by the increasingly ubiquitous connected devices, machines, and systems globally. Neural networks become more effective the more data that they have,meaning that as the amount of data increases the number of problems that machine learning can solve using that data increases. Mobile, IoT, and maturation of low cost data storage and processing technologies (often in the cloud) has created massive growth in the number, size, and structure of available data sets.For example, Tesla has aggregated 780mn miles of driving data to date, and adding another million miles every ten hours through its connected cars, while Jasper (acquired by Cisco for $1.4bn in Feb. 2016) has a platform powering machine to machine communication for multiple automobile manufacturers and
telco companies. Verizon made a similar investment in August when it announced it would acquire Fleetmatics, which connects remote sensors on vehicles to cloud software via increasingly fast wireless networks. The rollout of 5G will only accelerate the rate at which data can be generated and transmitted. Annual data generation is expected to reach 44 zettabytes (trillions of GB) by 2020, according to IDC’s Digital Universe report, a CAGR of 141% over five years, suggesting that we are just beginning to see the use cases to which these technologies will be applied.

2.
골드막삭스의 보고서는 투자자를 위한 것입니다만 AI가 발전하기 위한 생태환경을 잘 분석합니다. 연관산업을 잘 이해하여야 투자할 기업을 잘 선택하기때문입니다. 이 중 AI가 등장하기까지 어떤 기술적인 변화를 거쳤는지 설명하는 부분이 있습니다. 여기서 핵심은 클라우드, 오픈소스등입니다.

AI의 핵심개념으로 데이타, 클라우드, 오픈소스으로 정리할 수 있지만 인재(Talent)를 첫손으로 꼽는 분도 계실 듯 합니다. 이에 대한 골드만 삭스의 의견은 아래와 같습니다.

As the technology and tooling matures, talent may become less of a bottleneck. However, we believe talent will migrate to interesting, differentiated data sets. Due to this, we believe large differentiated data sets are the most likely driver of growth and incremental profit dollars as we move into an AI-centric world.

Download (PDF, 3.13MB)

딥런닝을 이용한 매매알고리즘을 연구하는 분들이 많은 듯 합니다. 무엇이 전제일까요? 결국 학습입니다. 방대한 데이타를 수집하여야 하고 수집한 데이타를 이용하여 훈련을 시킬 수 있는 컴퓨팅 환경을 만들어야 합니다. 선후를 따질 수 없지만 알고리즘이전에 검토할 것이 많습니다. 마지막으로 Machine Learning Cheat Sheet: Classical equations, diagrams and tricks in machine learning를 첨부합니다. 방대하지만 잘 정리한 문서입니다.

Download (PDF, 1.89MB)

Leave a Comment

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.