기계 는 어떻게 생각 하고 학습 하는가 독후감

구글 알파고가 이세돌을 꺾으며 인공지능은 이미 많은 대중들에게 깊숙히 인식 된것 같다. 인공지능을 악마로 표현하는 사람들도 있을 정도니 이에 대한 이해가 서로 많이 다른 것을 알 수 있다.

AI와 별로 상관없은 백엔드 개발쪽으로 일을 하고 있지만 요즘 워낙 핫한 분야라 관련한 기초 지식이라도 배울 겸 읽어보게 되었다.

인간을 본뜬 피조물
학습하는 기계
인간이 할 수 있는 일이라면
삶과 죽음의 문제
미지의 세계로
창작하는 기계
인공지능의 진정한 위험
기계가 인간 이후에 지구의 주인이 될 것인가?

책의 초반부는 아리스토텔레스의 삼단논법에서부터 시작하여 현대의 인공지능이 있기까지의 역사와 이야기들을 하고 있다. 이미테이션이라는 제목의 영화로 알려진 튜링의 이야기가 나온다. 튜링이 고안한 튜링머신, 상대가 인간인지 기계인지 확인하는 테스트인 튜링테스트 등은 흥미로운 주제이다. 자율주행자동차, IBM왓슨의 암진단 등 이미 기계가 많은 부분에서 인간을 대체하고 있다. 또한 전쟁에서 이제 사람이 아닌 기계들이 싸우는 시대가 도래하고 있다. 다양한 분야에서 기계가 인간을 대체하는데 이것이 윤리적으로 옳은가에 대한 문제도 있다. 기계가 가치 판단에 있어 이것을 어떻게 받아들일 것인지도 중요한 문제이다.

약한 인공지능과 강한 인공지능을 비교하면 아래와 같다.

약한 인공지능: 하나의 특정한 작업만 잘하는 인공지능. 예시: 바둑을 두는 알파고, 영화 추천하는 넷플릭스 추천 시스템 등
강한 인공지능: 여러 종류의 문제들을 해결해내는 인공지능. 예시: 터미네이터나 아이로봇, AI 등에 등장하는 로봇의 시스템 등

현재는 약한 인공지능에 대해서는 다양한 분야에서 빠르게 발달하고 있지만 강한 인공지능이 나오려면 앞으로 한참 남지 않을까 싶다. 그러니 기계가 인간을 지배하고 마음대로 조종하는 세상이 오는 것을 너무 걱정할 필요는 없을 것 같다. 약한 인공지능들이 다양하게 나와서 인간의 삶을 더 안전하고 편리하게 해주면 좋겠다.

인공지능에 대해 여러 관점에서 설명이 잘 되어 있어서 교양서로도 괜찮을 책이다. 기술의 발전에 대해 막연한 두려움이나 거부감 보다는 이를 잘 활용하여 인간의 삶에 이바지 하기를 바라는 것이 더 옳은 방향인 것 같다.

기게는 어떻게 생각하고 학습하는가, 한빛미디어(뉴 사이언티스트 외)

PT 면접을 준비하기 위해 기계는 어떻게 생각하는가를 읽게 되었다. 평소 미디어에서 인공 지능, 머신 러닝 등 다양한 미래 기술에 관한 이슈에 대한 얘기들을 할 때마다 내가 생각보다 그러한 부분들에 대하여 모르는 점이 많다고 생각하였다. 심지어 전공이 전자전기공학부인데도 말이다. AI 등 기본적인 개념들에 대하여 설명해 주는 책을 읽고 싶었다. 그래서 유튜브, 구글 등 검색을 하였고 기계는 어떻게 생각하는가를 알게 되었다.

기계는 어떻게 생각하는가는 구글 엔지니어링 팀 수석 리더가 쓴 책으로서 일반인들이 잘 알고 있는 주제를 바탕으로 인공 지능, 자율 주행 등이 어떻게 작동하는가에 대하여 쉽게 설명하고 있다.사실은 그렇게 쉽지는 않다. 나도 정리하면서 한 번 더 읽어봐야겠다. 특히나, 중간에 나오는 몇몇 개념들은 집중해서 읽어야 이해가 될 것이다. 하지만 걱정하지 않았으면 한다. 평소에 관련 분야에 관심 있는 사람이라면 충분히 이해가 될 정도라고 생각한다.

기계는 어떻게 생각하는가?

기계는 어떻게 생각하는가의 가장 큰 매력은 여러 가지라고 생각한다. 첫 번째로, 일반인들이 많이 아는 알파고, DARPA 등의 주제를 다룬 점이다. 두 번째로, 해당 주제들에 대한 개념들을 설명하면서 인공 지능 등과 관련된 기본 개념들을 설명한다는 것이다. 세 번째로, 대회 등에 대하여 정말 우리가 대회를 치루는 것처럼 레이싱하는 느낌으로 그 흐름을 따라간다는 것이다.

<< 이런 사람에게 추천합니다 >>

인공 지능, 자율 주행 등 미래 기술에 관심이 많은 사람

관련 분야에 종사하는 사람

지금부터 기계는 어떻게 생각하는가에 나오는 각 분야에서 기본 개념들을 정리할 것이다. 책을 읽은 사람이라면 정리한 내용을 보면서 책 내용을 떠올리면 좋을 것이다. 책을 읽지 않은 사람이라면 책을 읽기 전 준비 운동이라고 생각하고 본다면 책을 읽을 때에 이해가 더 잘 될 것이다.

1. 기본 개념

인공 지능은 단순히 컴퓨터가 어떻게 지능적인 일을 처리할 수 있는지를 다루고 한정된 범위에서 이와 관련된 문제를 연구한다.

머신 러닝은 데이터를 통해 학습한 내용을 바탕으로 컴퓨터가 영리하게 일을 처리할 수 있도록 하는 방법을 연구하는 분야이다.

2. 자율주행 – DARPA 그랜드 챌린지

DARPA 그랜드 챌린지란 미국 국방부 연구 기관인 국방고등기획국이 후원하는 세계 최초의 무인 자동차 장거리 경주 대회로서 저자는 이 대회를 계기로 자율 주행 분야가 획기적으로 발전하였다고 한다. 이 때 나온 자동차들이 현재 자율 주행 차들의 초기 버전일 것이라 생각한다.

두 번째 대회 우승한 스탠리의 구조

경로 탐색 알고리즘인 다익스트라 알고리즘을 활용하여 경로를 계산한다. 출발 지점에서부터 탐색 경계선을 하나씩 늘려 나가는 방법으로 경로를 찾는다. 이 프로그램은 탐색 경계선을 조금씩 전진해 나가다가 경계선의 위치가 최종 도착지가 될 때까지 이를 반복한다.

칼만 필터란 1960년대 고안된 수학 모델로서 측정된 사물의 위치 데이터를 바탕으로 현재 위치를 추정하여 사물의 위치를 추적하는 방법이다.

라이다는 레이저와 광학 센서를 결합한 것으로 음향 탐지기나 레이더와 비슷하지만, 음파나 전파를 사용하는 대신 물체의 표면에서 반사되는 빛을 측정한다는 점에서 차이가 있다.

보스의 경로 계획 모듈은 경주가 시작할 때 단 하나의 경로를 계획하던 스탠리와 달리 경로를 계획하는 동시에 현재 위치에서 다음 목적지까지의 최적 경로를 재평가하는 일을 반복해서 수행한다.

세 번째 대회 우승한 보스의 구조

보스와 스탠리의 가장 큰 차이는 모노폴리 판 모듈의 차이일 것이다. 모노폴리 판 모듈은 유한 상태 기계를 사용하여 구현했다. 유한 상태 기계는 컴퓨터 프로그램이 고려해야 하는 상태의 수를 제한함으로써 프로그램이 주변 상황을 추론할 수 있게 해준다. 유한 상태 기계가 작동하는 방식은 모노폴리 게임과 비슷하다. 말의 현재 위치는 플레이어가 현재 무엇을 할 수 있고 다음 번에 이동할 수 있는 위치를 결정한다. 게임의 규칙은 수많은 가능성을 제한하고 모노폴리 플레이어가 단순한 세계에서 게임을 즐기게 해 준다.

유한 상태 기계

보스와 스탠리에 적용된 핵심 설계 원리는 시스템을 하드웨어, 인지, 계획(추론) 레이어로 조직화하는 것이다. 인지 레이어가 주변 상황을 인식하는 작업을 처리하고 모노폴리 판 모듈이 예기치 않은 상황을 처리해 주기에 최상위 레이어는 수행해야 할 과제를 계획하고 경로를 탐색하기만 하면 된다.

3 레이어 구조의 하부에는 제어 레이어가 있다. 이동 계획 모듈, 운전대, 속도 제어기로 구성되어 있다. 제어 레이어는 PID 제어기를 포함하고 있다.

3 레이어 구조

3. 넷플릭스 프라이즈 – 영화 추천 알고리즘 대회

분류기는 자동으로 어떤 항목이 특정 범위에 속하는지를 자동으로 판별하는 방법을 제공한다. 머신 러닝에서는 이러한 기준을 특성이라고 한다. 이런 여러 특성을 결합해 점수를 만드는 가장 간단한 방법으로서 가중 평균을 구하는 것이다. 머신 러닝에서 분류기를 최적화할 때에는 데이터를 사용해 각 특성에 맞는 가중치를 알아내고 임계치를 정하게 된다.

평점을 행렬로서 정리함

행렬 인수 분해는 거대한 행렬이 중복된 정보를 많이 갖고 있다는 사실을 기반으로 한다. 일단 각 영화와 사용자에 대해서 이러한 데이터를 얻고 나면, 이 데이터를 사용해 특정 사용자가 임의의 영화를 좋아할지 예측해 볼 수 있다. 이들 정보를 결합하여 특정 사용자가 특정 영화를 얼마나 좋아하는지를 나타내는 점수를 계산해 낼 수 있다. 행렬 인수 분해라는 이름이 붙은 이유는 영화와 사용자에 대한 정보를 타나내는 숫자가 담긴 두 개 이상의 행렬(인수)을 곱해 거대한 평점 행렬과 같은 원시 데이터를 만들어 그 데이터로부터 근사치를 계산하는 방식이기 때문이다.

행렬 인수 분해의 예

4. 딥 마인드 – 아타리 게임

2014년 초, 구글은 딥마인드라는 비밀에 싸인 작은 회사를 5억 달러가 넘는 비용을 지불하고 인수했다. 그 당시 딥마인드의 직원은 50명에 불과했다. 딥 마인드는 강화 학습을 활용해 컴퓨터가 스스로 게임하는 방법을 배우게 하여 스페이스 인베이더라는 아타리 게임 중 하나를 하게 만들었다.

강화 학습이란 경험을 통해 학습할 수 있는 능력을 컴퓨터 프로그램에게 부여하는 방법을 연구하는 인공 지능의 한 분야이다. 강화 학습을 하는 컴퓨터 프로그램은 학습할 때 보상이나 처벌을 받는다. 프로그램을 학습시키려면 보상을 따라가게 하면 된다. 그 후 컴퓨터가 일정한 작업을 마칠 때마다 이러한 보상을 제공함으로써 해야 할 행동을 알려주는 것이다.

시점 할인(시점 조정)이란 보상을 받기 위해 기다려야 하는 시간이 길어질수록 보상으로서 가치는 떨어진다는 것이다.

정책 분리 학습이란 강화 학습 모델에서 상태에 따른 행위를 결정하는 최적의 정책을 학습하고자 할 때 학습하려는 목표 정책과 별도로 행동을 결정하는 행동 정책을 구분하야 두 개의 정책을 학습하는 방식이다.

딥마인드 아타리 에이전트가 미래를 예측할 때 고려해야 할 것은 오로지 에이전트의 현재 상태 뿐이다. 과거의 상태와 행동은 에이전트가 현재 상태에 어떻게 도달했는지를 알아내는 데 중요한 역할을 한다. 하지만 일단 에이전트의 현재 상태를 파악했다면 그 이전에 일어난 일들은 신경 쓰지 않아도 된다. 에이전트의 현재 상태에는 에이전트가 미래를 예측하는데 필요한 이전에 일어난 사건이 모두 반영되어 있다고 가정하기 때문이다. 이를 마르코프 가정이라 한다.

신경망을 통한 계산

신경망은 생물학에서 영감을 받아 만들어진 수학 함수로 상호 작용하는 인공 뉴런으로 구성된다. 뉴런이 활성화되면 일정 범위의 숫자값을 가질 수 있으며 희미하게 켜지거나 매우 밝게 빛날 수 있다. 뉴런이 활성화되지 않으면 전혀 빛을 내지 못한다. 각 뉴런이 켜졌는지 꺼졌는지는 이 뉴런으로부터 다른 뉴런으로 입력되는 뉴런의 밝기와 뉴런 간의 가중치에 달려 있다. 가중치가 클수록 하위 뉴런에 대한 상위 뉴런의 영향력이 커진다.

계산이 시작되면 첫 번째 레이어에 있는 뉴런의 밝기가 다음 레이어에 있는 뉴런의 밝기를 결정하며, 신경망을 따라 흐르는 정보가 출력 레이어에 닿을 때까지 계속된다.

신경망의 합성곱 레이어에는 원본 입력 이미지로부터 객체를 판별하는 부류기가 있다. 합성곱 레이어의 출력은 각 분류기마다 이미지 하나를 포함한다. 출력 이미지의 각 픽셀은 분류기가 입력 레이어의 픽셀 조각 각각에 적용된 결과이다. 분류기의 조건에 맞는 입력이 없으면 검은색, 있으면 흰색을 출력한다. 즉, 합성곱 레이어는 이미지에서 객체를 찾아 그 결과를 이미지 형태로 출력한다.

컴퓨터가 변형한 이미지

RNN은 순환 신경망으로서, 동일한 뉴런 유닛을 묶어서 입력을 차례대로 전달하는 신경망이다. 합성곱 필터에서는 동일한 가중치를 공유하는 필터들끼리는 서로 입력값을 전달하지 않는다. 그러나 RNN은 각각의 RNN 유닛이 자신의 출력값을 다음 입력값으로 전달한다.

5. 왓슨 – 제퍼디 퀴즈 쇼!

(1) 문제 분석

욋슨의 목표는 문제를 정보의 조각으로 분해하는 것이다. 가장 중요한 임무는 단서로 제시된 문장에서 실제 문제가 무엇인지를 구체적으로 요약하는 것이다. 이 단계에서 왓슨이 답변 유형에 대한 정보를 저장해 두었다가 이후 단계에서 답변 후보를 선별하고 답변의 범위를 좁히는 데 사용한다.

(2) 후보 생성

왓슨은 인간이 하는 방식으로 답을 찾지 않는다. 왓슨의 문제 해결 단계는 채용 조건에 완벽하게 들어맞는 사람을 찾아내는 채용 과정과 아주 비슷하다.

(3) 증거 수집

채용 과정에서 대면 면접과 유사하다. 왓슨은 답변 후보와 단서에 맞춰서 구체적인 검색 질의를 준비하여 자신의 데이터 소스를 조사한다. 왓슨은 문제 분석 단계의 단서에서 알아낸 정보와 답변 후보를 조사한 정보 등을 토대로 각각 연관된 데이터 소스에 맞는 검색 질의를 생성했다. 그 뒤 나중 단계에서 사용하기 위해 검색 결과를 저장했다.

왓슨의 증거 수집 단계

(4) 점수 계산

증거 수집 단계가 끝나면 왓슨은 이 결과를 점수 계산 알고리즘에 입력한다. 채점기 알고리즘은 답변 후보의 증거를 구성하는 각 정보가 단서에 얼마나 잘 들어맞는지를 평가한다.

(5) 집계와 순위 결정

왓슨의 집계와 순위 결정 단계

6. 알파고 – 이세돌과의 바둑

알파고의 수 예측 신경망은 플레이어가 할 수 있는 행동의 모든 경우의 수에 대한 확률 분포를 생성한다. 시뮬레이션을 통해 나머지 대국을 둔 후 가중치 주사위를 사용해 다음 수를 선택한다. 그러면 수 예측 신경망이 확률이 높다고 판단한 수가 선택될 확률이 높아진다.

이상 기계는 어떻게 생각하는가에 나오는 기본 개념들을 설명하였다. 이 이상은 너무 깊기도 하고 책의 내용을 전부 알려주는 것 같아 이 정도만 소개하였다.

이 책을 번역한 번역가는 한국은 인공 지능 시장을 선도할 수 있는 다양한 이유가 있음을 피력했다. 나 또한 같은 생각이다. 나는 일반인들도 기계는 어떻게 생각하는가와 같은 책을 많이 읽어 인공 지능 분야의 강자로서의 대한민국을 꿈꾼다.

기계 는 어떻게 생각 하고 학습 하는가 독후감 어떻게