지능정보산업의 현재와 미래

지능정보산업의 현재와 미래

 ‘정보화’라는 키워드가 본격적으로 회자된 지도 30여년이라는 세월이 흘렀다. 컴퓨터의 역사와 함께한 정보기술(IT)의 발전으로 갖가지 이기가 쏟아지면서 해가 갈수록 세상은 바뀌어왔고, 이제는 인터넷과 스마트기기를 통해 언제 어디서나 서로 연결된 사회에 이르렀다. 이에 따른 데이터의 폭증은 향상된 컴퓨팅파워 및 알고리즘과 함께 다시금 우리를 새로운 장으로 이끌고 있다.
혹자는 이를 ‘4차 산업혁명’이라고 부른다. 과연 ‘혁명’이라는 표현까지 쓸 필요가 있을지는 별론으로 한다면, 보다 급격해진 오늘날의 IT 변화에 있어 데이터를 기반으로 하는 지능화된 제품·서비스가 태풍의 핵으로 떠오르고 있다는 점은 부인하기 어렵다. 바야흐로 ‘지능정보’ 시대가 도래한 것이다. 이 거대한 흐름 가운데 우리는 어떤 길을 택해야 할지, 전문가들에게 의견을 청했다.
– 팽동현 기자(dhppp@itdaily.kr)

 
뱁새여도 황새 쫒아야
‘지능정보(Intelligent Information)’라는 단어는 지난해 3월 구글의 인공지능(AI) 바둑 프로그램 ‘알파고’가 이세돌 9단과의 바둑 대결에서 승리를 거둔 이후부터 본격적으로 거론되기 시작했다. 인공지능의 발전상을 실감한 국내 각계각층에 인공지능 열풍이 불면서, 사물인터넷(IoT), 클라우드, 빅데이터, 모바일 등 이른바 ‘ICBM’의 뒤를 이어 빅데이터와 인공지능을 주축으로 하는 ‘지능정보’가 우리나라 IT산업 진흥책의 키워드로 떠오른 것이다. 이에 따라 기존에 진행돼온 ‘소프트웨어(SW)중심사회’ 전략의 연장선상으로 ‘지능정보사회’ 추진이 새로운 과제로 자리했다.
김진형 지능정보기술연구원(AIRI) 원장은 “‘지능정보’라는 용어가 우리나라 외에도 흔히 쓰인다고 할 수는 없는데, 과거 ‘정보화 사회’라는 정책적 어젠다가 성공적이었기에 다시 ‘지능정보화’로 목표가 수립된 측면도 있다. 그간 우리나라 IT발전이 통신 중심으로 이뤄지면서 상대적으로 컴퓨팅 분야에 소홀하기도 했고, 특히 지식산업의 핵심인 SW를 홀대했다보니 인공지능 분야에서도 뒤처지게 된 것”이라며, “유수의 글로벌 기업들이 ‘AI퍼스트’를 외치며 대규모 자본을 투자하고 있고, 여러 논문과 공개SW를 통해 기술의 확산도 빠르게 진행되고 있다. 당장 선도는 못할지언정 빨리 배워서 쫓아가기라도 해야 하지 않을까. 어디까지 활용할 수 있고 어떤 한계가 있는지부터 깨달아야 한다”고 주장했다.
전문가들은 지능정보산업 육성이 시급하다고 입을 모은다. 세간의 이목이 쏠렸다가도 이내 그 열기가 식곤 했던 과거의 인공지능 붐과 달리, 컴퓨팅파워와 알고리즘의 발전으로 본격적으로 인공지능을 적용해볼 수 있는 기술역량이 마련됐고, 오픈소스 기반의 신경망 기술로 표준화가 이뤄지면서 기술 확산을 위한 환경과 비용효율성도 갖추게 됐기 때문이다. 또한, 전자상거래(이커머스)와 같은 플랫폼 비즈니스는 결국 시장과 자본의 규모가 결정적인 영향을 미치는 반면, 인공지능 분야는 비교적 네트워크 효과가 크지 않고 OSMU(원소스멀티유즈) 특성이 강하므로 ‘한류’처럼 우리나라가 전략적으로 육성할만한 산업분야로 꼽힌다.
솥뚜껑은 자라가 아니다
본격적인 지능정보산업 진흥을 위해서는 우리 사회에 만연해있는 인공지능에 대한 오해를 푸는 것부터 선행돼야 한다. 조만간 인공지능에게 일자리를 뺏길지 모른다는 불안감에서부터, 영화 터미네이터의 스카이넷과 같이 기계가 인류를 지배하는 세상이 임박했다는 막연한 공포에 이르기까지 다양한 형태로 부정적인 반응이 표출되고 있어, 과거 산업혁명기 러다이트 운동이 재현될지도 모른다는 우려도 존재한다.
전문가들 대다수는 그러한 강한(strong) 인공지능은 아직 존재하지 않고, 수십 년 내로 등장할 가능성도 희박하다고 잘라 말한다. 현재 기업들의 투자와 함께 급속도로 개발이 이뤄지고 있는 분야는 주로 가상비서나 음성인식 스피커와 같은 인터페이스 분야다. 지능을 갖춘 것처럼 스스로 문제를 해결하는 알고리즘 분야는 학계 위주로 연구가 진행되고 있으며, 바둑과 같이 실제세계와는 비교할 수 없을 만큼 제한된 환경에서 성과를 냈을 뿐 여전히 발전이 더딘 편이라는 설명이다. 전문가들은 인공지능이 어디까지나 ‘도구’라는 점을 강조한다.
또한, 인공지능이라고 하면 로봇을 연상하는 이들이 세간에 적지 않은데, 인공지능은 주어진 목적을 효율적으로 수행하기 위해 최적화되는 게 관건이다. 즉, 사람을 흉내 내는 게 곧 인공지능인 것은 아니라는 지적이다. 다만, 목적에 따라 자동화된 작업을 수행하는 약한(weak) 인공지능은 창의성과 사고력이 적게 소요되는 곳부터 사람들의 일자리를 대체해갈 수 있으므로, 이에 대한 사회적인 배려와 대책도 요구된다. 이러한 변화는 기술의 발전과 함께 인류 역사 내내 반복돼왔던 일이기도 하다. 가트너도 최근 연구조사를 통해 2020년에는 인공지능에 의해 사라진 일자리보다 생겨난 일자리가 더 많아질 것으로 전망했다.
세계인공지능학회의 인공지능응용상을 두 차례 수상한 바 있는 이경전 경희대학교 경영학과 교수는 “지난해 실리콘밸리에서도 챗봇 개발·도입 관련 여러 실패사례가 있었는데, 이는 수요기업과 공급기술의 갭(gap) 때문이다. 일부 언론이나 기업 마케팅, 또는 IT에 비전문적인 관련분야 학자들이 자꾸 영화 같은 예를 드니 기대가 커졌는데, 실제 써보고는 실망해 돌아서는 것이다. 또, 일반 사람들은 생각보다 기술 자체에는 관심이 없다. ‘챗봇주문’이라 써놨더니 잘 쓰이지 않아 ‘간편주문’으로 바꾸니 사용량이 늘어난 국내 사례도 있다”며, “인공지능 시스템을 만들어본 이들이라면 지금의 한계를 알고 신중하게 접근할 것이다. 아직 미국시장에서도 인공지능 시스템 도입에는 신중한 편인데, 국내 일각에서는 큰 비용을 들여가면서 글로벌 기업들의 테스트베드를 자처하는 것 같아 안타깝다”고 지적했다.
지능정보도 사람이 미래다
지능정보산업 진흥에 있어 가장 큰 걸림돌로 지적되는 것은 바로 전문인력 부족이다. 전문인력이 곧 기술력인 SW산업이기 때문이다. 지난해 인공지능 열풍이 불기 전까지 인공지능 전공자 수 자체가 적었고, 그들도 2000년 전후의 닷컴 버블 시기에 검색엔진 기술력을 필요로 하는 이커머스 등의 분야로 자리를 옮기기도 했다. 더욱이 현재 배출되는 인재들마저 글로벌 기업에서 거액을 들여 데려가고 있는 실정이다. 이러한 문제들은 일부 선진국을 제외하고는 현재 공통적으로 겪고 있는 현상이라 볼 수도 있다. 가장 큰 문제는 당장 학생들을 가르칠 전문가가 부족하다는 것이다.
전문가들은 이에 대해 국가 차원의 선진국 연수와 전문인력 수입 추진부터 공개SW 활용 및 기여(contribute)를 통한 독학 장려에 이르기까지 다양한 의견을 내놨다. 공통적으로 지적된 부분은, 기술을 개발할 수 있는 핵심인력은 소수여도 충분하지만 기술을 이해하고 적용해볼 수 있는 융합형 인재는 전 산업분야에 확산될 필요가 있다는 것이다. 같은 맥락에서, 도메인 날리지를 지닌 각 산업분야 재직자들을 대상으로 인공지능 교육을 실시해 경쟁력을 높이고, 또 기업의 인공지능 전문가들도 구체적인 산학협력을 통해 학교의 전문인력 양성에 힘을 보태야 한다는 데도 뜻을 같이했다.
이지형 성균관대학교 지능정보융합원 부원장 겸 SW학과 교수는 “인공지능 기술은 공개와 협업을 통해 발전하고 있어, 이 분야에서도 이제 우리나라의 ‘패스트 팔로워’ 특징이 나타나 열심히 쫓아가는 것으로 보인다. 현재 인공지능 교육에 필요한 것은 당면과제를 위한 제도적 개선 등도 있겠지만, 장기적인 관점에서의 저변 확대와 공감대 형성이라 생각한다”며, “학생들의 인공지능에 대한 관심이 부쩍 높아진 것은 사실인데, 인공지능을 가르치면서도 골고루 역량을 쌓는 것을 권장하고 있다. 인공지능이라는 도구로 무엇을 해내느냐가 더 중요하기 때문이다. 인재 양성은 물론 산업 진흥에 있어서도 조급하게 성과에 목메기보다는 장기적인 시각에서 전방위적으로 추진돼야 한다”고 제안했다.
데이터 부족 고질병
기본적인 규칙 외에 어떠한 인위적인 ‘지도학습(supervised learning)’ 없이 스스로 ‘강화학습(reinforcement learning)’을 통해 바둑을 익혀 기존 알파고를 격파한 ‘알파고 제로’도 지난달 등장했지만, 보다 광범위한 분야에서 여전히 데이터는 인공지능 성능의 기반으로 여겨지고 있다. 글로벌 기업들은 각 산업분야 데이터 확보를 위해 거액의 투자를 마다하지 않고 있다.
국내에서 빅데이터 분석이 화두로 떠올랐을 때부터 제기됐던 데이터 부족 문제는 인공지능 분야로도 이어지고 있다. 데이터의 절대적인 양보다는, 분석에 적합한 데이터가 부족하다는 지적과 마찬가지로, 학습을 시킬 만한 데이터가 부족하다는 지적이다. 여러 전문가들은 데이터를 유기적으로 수집하고 활용하는 측면에서 개선될 필요가 있다는 의견을 냈다. 단순히 데이터를 모으는 게 관건이 아니라, 분석과 학습에 활용할 수 있도록 그 목적에 맞는 데이터를 찾을 필요가 있다는 설명이다.
또한, 개인정보 보호법 개정에 대한 필요성도 제기됐다. 프랑스의 경우 ‘디지털공화국법(Digital Republic Act)’으로 전면적인 데이터 개방이 추진되는 반면, 우리나라에서는 개인정보 보호에 지나치게 중점을 두고 있어 데이터의 수집과 활용 및 유통에 제약을 받고 있다. 핵 기술이 무기 제조에도 쓰이지만 전력수요 충당에 큰 몫을 하고 있듯, 개인정보 관련 문제 역시 관리에 달려있다는 것이다. IT업계의 의견을 참고해 보호가 필요한 민감 데이터를 세부적인 단계로 구분하고, 분야별로 제각기 나뉘어있는 각 정부부처와 공공기관의 데이터 관리도 유기적으로 통합하며, 자신의 개인정보에 대한 소유 및 처분 권한을 개인 스스로에게 맡길 필요가 있다고 전문가들은 주장했다.
데이터마이닝·머신러닝 전문가인 전용준 리비젼컨설팅 대표는 “데이터를 통한 문제 해결에 있어 양이 관건이 되는 경우가 있고, 질이 관건이 되는 경우도 있다. 지금까지 인공지능으로 거둔 성과들은 대부분 양적인 부분에 한정돼있다고 할 수 있다. 앞으로 질적인 부분에도 주목한다면 더 큰 가치를 추구할 수 있을 것으로, 양적인 측면은 자본의 힘에 좌우될 수 있지만 질적인 측면은 꼭 그렇지 않다는 점도 생각해볼만한 부분”이라며, “장차 인공지능은 데이터의 양보다는 질에서 승부가 갈릴 것으로 보인다. 인해전술 식으로 데이터를 많이 학습시킨다고 해서 원하는 목적을 달성할 수 있는 게 아니다. 도메인 날리지 등을 기반으로 얼마나 양질의 알고리즘을 갖느냐가 관건이 될 것”이라고 설명했다.
지능정보산업 진흥도 한 걸음부터
이밖에도, 언어장벽을 극복하기 위한 영어 학습부터 데이터 기반 의사결정 및 창의성을 뒷받침할 자유로운 조직문화 등에 이르기까지 지능정보산업 육성을 위한 다양한 의견이 나왔으며, 국내 업계에서 이정표로 삼을 만한 ‘아이콘’의 탄생이 필요하다는 의견도 여럿 있었다.
전문가들의 의견이 갈린 부분은 대기업과 중소중견기업 가운데 어느 곳을 중점적으로 지원하느냐는 것이었다. 자본과 역동성을 갖춘 미국시장과는 달리 국내에서 관련 제품과 서비스로 글로벌 경쟁력을 갖출 만한 곳은 대기업밖에 없다는 주장도 있었고, 또 한편에서는 상업적인 측면을 배제하고 전문성을 기준으로 중소중견기업들을 중점적으로 지원해야 한다는 견해도 있었다. 그러나 규모와 분야에 상관없이 인공지능에 관심을 갖고 각자의 상황에 맞춰 다양한 시도를 해볼 필요가 있다는 점은 같았다. 이를 위해서는 자유롭게 도전하고, 또 실패해도 다시 일어설 수 있도록 정부 차원의 전폭적인 지원이 필요할 것이다.
김명준 소프트웨어정책연구소(SPRi) 소장은 “인공지능 기술에만 초점을 맞춰서는 지능정보산업 진흥에 속도를 낼 수 없다. 인공지능은 데이터를 필요로 하고, 이들이 모인 빅데이터는 클라우드에 저장되며, 그 학습과 활용에 고성능 컴퓨팅이 요구되기도 한다. 지능정보산업 진흥을 위해서는 결국 ‘ABCi(AI·빅데이터·클라우드·IoT)’를 모두 갖출 필요가 있다”면서, “세계경제포럼이 발간한 글로벌 경쟁력 보고서에 따르면, 우리나라는 고용경직성, 금융시장 개발, 법·제도·규제 등에서 경쟁력이 뒤처진 것으로 평가된다. 인공지능이라는 새로운 시장만 바라볼 게 아니라, 그 기반을 이루는 산업분야들은 물론 지능정보를 통해 개선 가능한 다양한 문제들에도 초점을 맞춰야 한다”고 강조했다.
인공지능 기술이 전 세계적인 화두로 떠오르면서, 정부의 지능정보산업 진흥에 대한 의지도 여느 때보다 높아 보인다. 인공지능 분야는 그 원대한 전망에 비해 이제 본격적인 활용의 첫걸음을 뗐다고 볼 수 있다. 즉, 지금이야말로 더 늦기 전에 이 흐름에 올라타야 할 시기다.
전문가들은 정부와 기업에서 먼저 스스로의 문제 해결에 인공지능과 빅데이터의 활용을 시도해보고, 기술 개발과 인력 확충 및 시장 창출에도 투자를 아끼지 말아야 한다고 입을 모은다. 이를 위해서는 무엇을 위해, 어디에 집중하고, 어떻게 활용해나갈지 구체적인 전략을 수립하는 한편, 소위 ‘무늬만 AI’도 걸러낼 수 있어야 할 것이다. 공부와 도전이 필요한 시점이다.
알파고 이후 인공지능(AI)은 더 이상 대중들에게 비현실적인 것이 아니게 됐다. 구글이 기획한 세기의 바둑대결은 SF 안에서만 존재하던 머나먼 AI를 일반인의 곁으로 끌어내린 계기가 됐다. 이제 우리는 다양한 매체나 광고를 통해 AI라는 단어를 쉽게 찾아볼 수 있게 됐으며, ‘자동화된 서비스’에 AI를 접목하는 것은 이제 매우 흔한 일인 것처럼 보인다. 아직 AI가 사회 전반을 아우르는 영화 같은 시대는 오지 않았지만, 적어도 AI의 대중화가 빠르게 진행되고 있다는 점은 부정할 수 없어 보인다.
<소프트웨어> AI 대중화의 기수, 음성인식 – 김성수 기자(kimss56@itdaily.kr)
“시리야”, “오케이 구글”
알파고가 AI를 대중에게 가까운 곳으로 가지고 오는 계기가 됐다면, 이를 대중들의 바로 곁에서 직접 접할 수 있도록 만들고 있는 것은 단연 음성인식 기반의 AI비서나 스마트 스피커 등일 것이다. 애플이 아이폰4S와 함께 야심차게 내놓은 ‘시리(Siri)’는 한동안 아이폰 사용자들이 “시리 좀 보여 달라”는 요구에 시달리게 만들었으며, 지난 9월 한국어 서비스를 시작한 ‘구글 어시스턴트(Google Assistant)’는 수많은 안드로이드 스마트폰 사용자들이 시킬 일도 없으면서 “오케이 구글”을 중얼거리게 만들었다. 삼성전자가 자사 최신 모바일 디바이스에 탑재한 ‘빅스비(Bixby)’ 역시 높은 인지도와 스마트폰 점유율을 바탕으로 입지를 넓혀가고 있다.
또한 최근 몇 년 사이에는 아마존 ‘에코(Eco)’나 ‘구글 홈(Google Home)’, SK텔레콤 ‘누구(NUGU)’, KT ‘기가지니(GiGA Genie)’, 네이버 ‘웨이브(WAVE)’ 등 다양한 가정용 스마트 스피커들이 앞 다퉈 출시되고 있다. 이들은 자사 서비스와의 연동을 통해 각각 특화된 기능을 내세우며 이제 막 형성되고 있는 시장에서의 입지를 넓히고자 발 빠르게 움직이고 있다.
 

▲ 스마트 스피커 시장의 각축전이 계속되고 있다.

 
 
무엇보다 시장 선점이 중요하다
 
지난 9월 ‘카카오 미니(Kakao Mini)’의 예약구매를 시작하며 스마트스피커 시장에 뛰어든 카카오는 다양한 행보를 통해 음성인식 기반의 스마트홈 구축에 나섰다. ‘카카오 미니’에는 카카오의 AI플랫폼 ‘카카오 아이(I)’가 탑재돼 음성인식 및 합성, 자연어처리, 빅데이터·머신러닝 기반 추천 등 다양한 기능을 제공할 수 있다. 특히 카카오가 내세우는 가장 큰 무기는 ‘카카오 미니’를 통해 ‘카카오톡’ 메시지를 보낼 수 있으며, 음성인식이나 ‘카카오톡’ 메시지를 통해 자체적으로 제공할 수 있는 서비스가 매우 다양하다는 점이다.
사실 ‘카카오톡’을 위시한 다양한 서비스와 높은 점유율은 사용자 입장에서 편하기도 하지만 플랫폼 사업자에게 매우 유리한 조건이다. 카카오는 이미 ‘카카오톡’을 통해 음식을 주문하거나 스토어를 이용할 수 있는 서비스를 제공하고 있으며, 자체 개발한 ‘카카오 페이’를 통한 송금이나 결제 역시 ‘카카오톡’ 내에서 가능하다. 최근에는 택시·대리운전·주차·내비게이션 서비스를 통합한 스마트 모빌리티 플랫폼 ‘카카오T’도 공개했다. 이는 즉 ‘카카오톡’을 자사 서비스의 중심에 두고 ‘카카오 미니’가 ‘카카오톡’ 메시지를 보낼 수 있도록 만드는 것만으로도 향후 추가적인 서비스를 쉽게 접목할 수 있게 된다는 것이다.
가령 프랜차이즈 음식점이 카카오와의 제휴를 통해 ‘카카오톡’ 메시지로 주문을 접수할 수 있게 된다면, 이는 별도의 기술 개발 없이도 ‘카카오 미니’에서도 주문이 가능해진다는 것을 의미한다. 사용자가 “XX에서 피자 주문해줘”라고 말하면 ‘카카오 미니’는 해당 음성을 인식해서 ‘카카오톡’ 메시지를 보내고 ‘카카오페이’로 결제하면 되기 때문이다. 이는 스마트 스피커 시장이 아직 초창기이며, 많은 기업들이 제공하는 서비스 확장에 골몰하고 있다는 점을 감안한다면 매우 큰 장점이 될 수 있다.
스마트 스피커와 함께 음성인식 스마트홈의 각축전이 벌어지고 있는 곳은 다름 아닌 건설업계다. 이미 SK텔레콤은 지난해부터 SK건설과 현대건설, 포스코건설 등을 포함해 국내 25개 주요 건설사들과 제휴를 맺고 신규 분양하는 아파트 단지에 스마트홈 서비스 공급을 추진, 지난 8월 기준으로 약 1만 세대 이상의 아파트에 자사 스마트홈 서비스를 공급했다. 해당 스마트홈 서비스는 음성인식 및 모바일 앱을 활용해 집안의 조명이나 난방을 통제하는 것은 물론, 65개 제조사 300여 가전기기와의 연동을 제공해 단일한 인터페이스에서 가정 내 모든 시스템을 제어할 수 있도록 한다. 또한 사용자의 패턴을 학습하고 집안 온도나 공기 오염 수준 등을 파악해 편리하고 쾌적한 주거 환경을 제공한다는 설명이다.
90년대부터 ‘가정 내 미래의 기술’로 언급되던 음성명령 혹은 자율판단을 통한 집안 제어가 현실적으로 가능해진 것이다. LG유플러스와 같은 여타 통신사업자나 네이버·카카오 역시 너나 할 것 없이 건설사와의 업무 협약을 통해 자사의 AI 플랫폼을 활용한 스마트홈 서비스 개발 및 구축에 나서고 있으며, 단순히 집안 내 IoT기기들을 제어하는 것이 아니라 실생활 전반에 걸쳐 제공 가능한 서비스들을 제공해 사용자의 만족도를 높이고 플랫폼 영향력을 확대해 나간다는 방침이다.
한편 ‘시리’나 ‘구글 어시스턴트’, ‘빅스비’ 등의 모바일 AI비서들은 특정 모바일 기기에 종속적인 만큼 그나마 경쟁이 적은 편이다. 특정 모바일 AI비서가 탑재됐다고 해서 스마트폰을 선택하는 경우는 아직 드물기 때문이다. 그러나 이 시장 역시 업계의 주목을 받고 있는 것은 물론이다. 앞서 삼성전자는 자사 AI비서 ‘빅스비’와 카카오의 AI플랫폼 ‘카카오 아이’를 연동하겠다고 밝힌 바 있다. 이를 바탕으로 삼성전자는 ‘빅스비’가 제공할 수 있는 서비스의 범위를 넓힐 계획이다.

 

▲ 모바일 AI비서는 상대적으로 경쟁이 덜하지만, 기술 경쟁은 치열하다.

 
기본적으로 ‘빅스비’ 등의 AI비서는 별도의 제휴를 체결하지 않는 이상 각각의 애플리케이션의 세부적인 기능을 활용할 수는 없다. 가령 “카카오톡 켜줘”라는 명령은 수행할 수 있지만, “카카오톡에서 OO한테 메시지 보내줘”라는 구체적인 명령은 수행할 수 없다. 이는 AI비서가 모바일 기기에 탑재된 앱들의 세세한 기능까지 모두 파악하고 이를 통제할 수 있는 권한을 가질 수는 없기 때문이다.
앞서 아마존과 마이크로소프트가 체결한 ‘알렉사’와 ‘코타나’의 협력 역시 이런 문제를 해결하기 위한 것이었다. ‘알렉사(혹은 코타나)’가 ‘코타나(혹은 알렉사)’의 기능을 활용하기 위한 요청을 보내면, 요청을 받은 쪽에서 해당 기능을 수행함으로써 앱의 기능 파악과 권한 설정 문제를 해결하는 식이다. 따라서 삼성전자는 카카오와의 제휴를 통해 ‘빅스비’에서 ‘카카오 아이’에 요청을 보내는 식으로 카카오가 제공하는 다양한 콘텐츠와 기능을 사용할 수 있도록 한다. 반면 카카오는 자체 생산하는 모바일 기기가 없으니만큼 ‘빅스비’를 통해 편리한 사용자 접점을 신속하게 마련한다는 방침이다.
한 업계 관계자는 “아직 사용자들에게 필요성이 검증되지 않았고 명확한 시장도 형성되지 않았지만, 무엇보다 개인화된 편의성을 제공하는 분야이기에 보다 많은 사용자들이 자사 기기와 플랫폼에 익숙해질 수 있도록 선점이 가장 중요하다”고 강조했다.

 

“음성인식은 마우스 이상의 혁명”
스마트폰은 국내에서도, 전 세계적으로도 이제 보편적인 개인 휴대기기가 됐다. 최신 삼성기기에만 탑재된 ‘빅스비’는 예외로 치더라도, iOS와 안드로이드가 스마트폰 시장의 대부분을 차지하고 있는 만큼 ‘시리’와 ‘구글 어시스턴트’의 보급률도 매우 높다. 하지만 아이폰과 안드로이드 스마트폰을 사용하는 사람 중 AI비서를 적극적으로 활용하는 사람이 얼마나 될까? 아직까지 AI비서는 ‘재미있고 신기한 기능’이지, 기존의 조작방식을 완전히 대체할 수 있는 수단에는 이르지 못했다.
음성인식 기반의 AI비서에 대해서는 애초에 사용자들의 기대도 그리 높지 않은 것으로 보인다. ‘시리’나 ‘구글 어시스턴트’, ‘빅스비’ 등을 활용하면서 영화 ‘아이언맨’에 나오는 ‘자비스’ 수준을 기대하는 사람은 없을 것이다. 토니 스타크의 음성명령을 수행하는 것은 물론, 사용자의 심리상태와 주변 상황까지 파악하고 정확한 서포트와 조언을 건네는 ‘자비스’는 AI가 대중화된 지금에서도 여전히 SF의 영역이다.
 

▲ ‘자비스’ 수준의 AI비서는 아직까지 SF의 영역이다.

 
음성인식은 분명 매우 어렵고 복잡한 기술이며, IT의 최첨단에 있는 기술이다. 입력장치에서 발화자의 목소리만을 걸러내고 화자마다 다른 높낮이나 억양을 분석하는 것만 해도 쉬운 일이 아니다. 지난 수년간 모바일 기기의 음성인식 기반 AI비서들이 많은 기술적 발전을 이루었지만, 아직도 우리는 AI비서에게 “다시 한 번 말씀해주십시오”라는 대답을 듣는 것에 익숙하다. 음성인식 기술도 이를 받아들여 정확한 답변을 내주는 기술도 갈 길이 멀다. 그럼에도 불구하고 수많은 기업들이 음성인식 기반의 AI 서비스 개발에 나서고 있는 이유는 명확하다. 거기에 명확한 가능성이 보이기 때문이다.
입력장치는 항상 더욱 편리하고 직관적인 방향으로 발전해왔다. 텍스트 입력만 가능한 키보드에서 2D화면의 자유로운 조작과 GUI 사용이 가능해진 마우스로, 스마트폰의 대중화에 따라 수많은 ‘엄지족’들을 양산하고 있는 터치 방식으로, 입력장치는 항상 더욱 쉽고 직관적인 것을 찾는다. 그런 점에서 본다면 손가락 하나 까딱할 필요 없는 음성인식은 분명 그 무엇보다도 쉽고 직관적이다.
머신러닝을 통해 자연어처리(Natural Language Processing, NLP)의 품질이 향상된 뒤로는 더욱 그렇다. 과거에 텍스트나 음성인식을 통한 명령을 내릴 때는 컴퓨터가 이해할 수 있는 문법과 단어를 골라서 사용해야했지만, 자연어처리가 보편화된 뒤로는 표준어로 말하기만 하면 얼마든지 사용자의 의도를 인식할 수 있게 됐다. 그러므로 음성인식 기능을 활용하는 사용자는 키보드 타자연습이나 마우스의 사용방법을 배울 필요도 없이 그저 말로 지시하면 된다. 이보다 편리한 입력장치는 적어도 현 시점에서는 존재하지 않는 것처럼 보인다. 이에 대해 한 업계 관계자는 “음성인식과 챗봇의 결합은 마우스 이상의 혁명”이라고 강조했다.
보다 편리한 입력장치를 원하는 사용자들은 물론, 정보접근성이 떨어지거나 새로운 기능을 배우기 어려워하는 사람들에게도 음성인식은 손쉽게 다가갈 수 있다. 아직은 부족한 부분이 많은 음성인식 기술이 시간이 지남에 따라 더욱 발전된다면, 그리하여 키보드·마우스 및 터치와 나란히 서서 입력장치의 한 축으로 자리 잡게 된다면, 나이 드신 어르신들이 손주들과 소통하기 위해 ‘카카오톡’ 사용 방법을 배우느라 골머리 썩일 일은 없을 것이다.

 

AI를 가져오는 가장 가까운 길
AI의 적용 범위는 여전히 무궁무진하다. 이제는 새로운 IT기술이나 서비스가 머신러닝이나 딥러닝이라는 수식어를 달지 않은 경우를 오히려 찾아보기 어려울 정도다. 축적된 데이터를 바탕으로 사용자의 편의성을 높이고 보다 정확한 결과값을 얻어내는 서비스는 지금도 한창 개발 도상에 있다. 이는 비단 IT산업계만의 이야기가 아니며, 제조 공장의 품질관리에서부터 식당의 매출 관리에 이르기까지 모든 산업 분야에서 크고 작게 일어나고 있는 일들이다.
그러나 가장 일반 대중에게 가깝게, 그들의 곁에서 AI의 대중화를 가속시키고 있는 것은 음성인식 기반의 AI비서나 스마트 스피커와 같은 실제 서비스들이다. 이것은 ‘자비스’와 같은 헐리웃 영화의 SF적인 묘사나 알파고가 가져다준 AI에 대한 인식에 의한 것이지만, 다르게 말하면 기업들이 보유한 AI 기술력을 드러내고 IT기술이 가져다줄 편의성을 보일 수 있는 가장 빠른 길이기 때문이기도 하다. 음성인식 기술의 발전이 가져올 보다 편리하고 직관적인 미래상을 기대해본다.
<컴퓨팅> 빠르게, 더 빠르게…AI 컴퓨팅 성능 경쟁 – 정종길 기자(gil0717@itdaily.kr)
 
오늘날 AI의 빠른 확산을 가능하게 한 머신러닝, 특히 딥러닝의 발전에는 하드웨어 기술의 뒷받침이 있었다는 점을 빼놓을 수 없다. 점점 더 복잡해지는 딥러닝 모델을 보다 빠르게 훈련시키기 위해 AI 연구자 및 기업들은 더욱 강력한 컴퓨팅 파워를 필요로 하고 있는데, 이를 만족시키기 위한 기술로서 최근 급속도로 발전을 거듭하는 GPU를 비롯해 ASIC(Application Specific Integrated Circuit, 주문형 반도체)과 FPGA(Field-Programmable Gate Array) 등이 떠오르고 있다.

 

AI 위한 딥러닝 가속, GPU가 주도
 
CPU 대비 매우 많은 수의 코어를 갖춰 병렬연산에서 강점을 보이는 GPU는 현재 AI 구현을 위해 필수적인 범용 인프라로 꼽히고 있다. 엔비디아는 지난 2007년 그래픽 처리에 특화된 GPU를 연산에 이용하는 GPGPU(General-Purpose computing on Graphics Processing Units, GPU를 이용한 범용 계산) 기술 ‘쿠다(CUDA)’를 발표한 이래, 오늘날 AI 구현을 위한 하드웨어 부문에서 가장 중요한 기업으로 떠올랐다.
엔비디아는 2010년 발표한 ‘페르미(Fermi)’와 2012년 ‘케플러(Kepler)’, 2014년 ‘맥스웰(Maxwell)’ 아키텍처를 거쳐 2016년에는 ‘파스칼(Pascal)’ 아키텍처 기반의 ‘테슬라(Tesla)’ GPU 가속기 시리즈를 선보였다. ‘파스칼’ 기반의 엔비디아 ‘테슬라 P100’ GPU 가속기는 올해 페이스북의 차세대 인공지능(AI) 서버 ‘빅베이슨(Big Basin)’을 비롯해 일본의 초고속 AI 슈퍼컴퓨터 ‘츠바메(TSUBAME) 3.0’, ‘구글 클라우드 플랫폼(GCP)’ 등에 탑재됐다.
여기에 엔비디아는 올해 5월, 최신 ‘볼타(Volta)’ 아키텍처와 함께 ‘테슬라 V100’ 데이터센터 GPU를 공개했다. 7세대 GPU 아키텍처 ‘볼타’는 210억 개의 트랜지스터로 이뤄져 있으며, 이를 기반으로 CPU 100개 수준의 성능을 구현하며 딥러닝을 구현한다. ‘볼타’의 최대 성능은 120테라플롭스(TFlops) 수준으로, ‘파스칼’ 대비 5배, 2년 전 출시된 ‘맥스웰’ 아키텍처 대비 15배 향상됐다. 이는 무어의 법칙으로 예측된 수준을 4배가량 넘어선 성능 개선이라는 설명이다.
 

▲ 엔비디아 ‘테슬라 V100’ 데이터센터 GPU

 
특히 ‘볼타’는 5,120개의 쿠다 코어는 물론, 640개의 새로운 ‘볼타 텐서 코어(Volta Tensor Core)’를 통합 아키텍처에 결합시켰다. 이로써 ‘테슬라 V100’ GPU를 탑재한 1대의 서버가 기존 고성능컴퓨팅(HPC)에 필요한 수백 개의 일반 CPU를 대체할 수 있다.
‘볼타’ 아키텍처 기반 ‘V100’ GPU 가속기는 올해 말부터 글로벌 클라우드 서비스 업체들을 통해 제공될 예정이다. ‘볼타’ 기반 서비스에 대한 적극적 추진 및 구체적 지원 계획을 밝힌 기업들로는 아마존웹서비스(AWS), 바이두, 구글클라우드플랫폼(GCP), 마이크로소프트(MS) ‘애저(Azure)’, 텐센트 등이 있다.
이 외에도 표준 서버를 위한 PCIe 시스템용 엔비디아 테슬라 ‘V100’ GPU 가속기 역시 올해 말부터 엔비디아 리셀러 파트너와 휴렛팩커드엔터프라이즈(HPE) 등의 제조업체를 통해 제공될 전망이다.

 
 

GPU 중요성 확대, 인프라 도입도 늘어
한편, 인텔이 최근 새롭게 출시한 데이터센터용 ‘제온 스케일러블 프로세서’를 살펴보면, 이 역시 AI를 위한 시스템에 더욱 적합하게 진화했음을 알 수 있다. 기존의 인텔 프로세서 기반 1소켓 서버에서는 GPU를 2개까지 꽂아 쓸 수 있었지만, ‘제온 스케일러블’ 시스템은 PCIe 레인을 늘려 최대 3개의 GPU를 지원한다. 여기에 AI 부문 데이터센터용 프로세서임을 강조하고 나선 AMD의 ‘에픽’ 프로세서는 1소켓 시스템에서도 최대 6개의 GPU를 지원한다.
즉, 인텔과 AMD의 새로운 프로세서에 기반한 최신 시스템들은 서버 노드 추가 없이 기존보다 더 많은 GPU를 사용할 수 있으므로, 보다 효율적으로 컴퓨팅 성능 향상 효과를 낼 수 있다는 것이다. AI를 위한 시스템을 구축하는 데 있어 GPU가 중요해졌음을 체감할 수 있는 부분이다.
같은 맥락에서 이미 지난 2011년 국내 기업 코코링크는 단일 스위칭 패브릭에 8대의 GPU를 장착할 수 있는 ‘클릭(CliC) 80000’ 시스템을 최초로 선보이기도 했다. 회사는 2013년에는 무려 20대의 GPU를 장착할 수 있는 고집적 HPC ‘클라이맥스-210(KlimaX-210)’을 공개했으며, 이후로도 다양한 폼팩터의 고성능 시스템을 만들고 있다.
코코링크에 따르면 현재 ‘클라이맥스-210’은 미군 해군연구소에서 함정에 탑재해 사용하고 있으며, 프랑스 오렌지텔레콤에서는 코코링크의 솔루션을 AI 기반 음성 서비스용 서버용으로 운용할 예정이다.
또한 국내에서도 학계는 물론 기업 시장까지, AI를 위한 딥러닝용 GPU 기반 시스템의 도입이 확대되고 있는 분위기다. 지난 8월 한국IBM은 경북대가 인공지능 국가과제를 수행하기 위해 ‘HPC용 IBM 파워 시스템 S822LC’ 도입을 결정했으며, 수원대 역시 AI 교육 및 실습을 위해 같은 제품을 도입, AI 인재를 양성하고 있다고 밝힌 바 있다.
이 밖에 국내 서버·스토리지 기업인 태진인포텍은 ▲GPU 가속기 4대를 탑재할 수 있는 ‘TJS212-G4’를 3분기에 출시하고 ▲GPU 가속기 8대를 탑재 가능한 ‘TJS212-G8’을 4분기 선보이며 HPC 시장 트렌드에 대응해나간다는 계획이다.
한국HPE의 경우 지난 9월 기자간담회를 통해 “전 세계 기업들의 기술 투자액에서 머신러닝 관련 투자 비중이 가장 크게 나타나는 가운데, 국내에서도 머신러닝을 위한 한국HPE의 HPC 솔루션 매출이 수백억 원을 기록하면서 연평균 30% 이상의 성장을 보이고 있다”고 언급하기도 했다.

 
 

AI 위한 GPU 컴퓨팅, 클라우드에서도 확대
퍼블릭 클라우드에서의 GPU 가속 지원도 국내외를 막론하고 확대되고 있다. 최근 엔비디아와 AWS는 딥러닝 활성화를 위해 글로벌 및 한국 시장에서의 협력을 강화한다고 밝혔다. AWS 클라우드 위에 엔비디아의 최신 GPU가 탑재된 ‘아마존 EC2’ 인스턴스를 통해 보다 많은 사람들이 딥러닝 실행에 도움을 받을 수 있을 것이라는 게 양사의 기대다.
‘구글클라우드플랫폼’ 역시 엔비디아의 GPU를 지원, 전 세계 ‘구글 컴퓨트 엔진(Google Compute Engine, GCE)’ 및 ‘구글 클라우드 머신러닝(Google Cloud Machine Learning)’ 사용자들이 ‘테슬라’ GPU를 활용할 수 있게 됐다.
또한 MS는 엔비디아 ‘테슬라 P40’ GPU를 기반으로 딥러닝 훈련 및 추론에서 탁월한 성능을 발휘하는 ‘ND’ 인스턴스를 서비스할 예정이다. ‘ND’ 인스턴스는 24GB의 메모리를 바탕으로 FP32 및 MS ‘코그너티브 툴킷(Cognitive Toolkit)’, ‘텐서플로우(TensorFlow)’, 그리고 기타 딥러닝 프레임워크 사용에서 전 세대 대비 2배 이상의 성능을 제공한다.
국내 클라우드 전문기업 이노그리드 역시 자사 퍼블릭 클라우드 서비스인 ‘클라우드잇’ 기반 GPGPU 서비스 ‘긱스(GICS, GPU Infinit Cloud Service)’의 기업 수요가 크게 증가하고 있다고 밝혔다.
회사에 따르면 정보보안 전문기업 펜타시큐리티시스템이 머신러닝 기반의 네트워크 분석을 통한 지능형 공격 방어기술을 개발하기 위해 ‘긱스’를 도입했으며, 지능형 언어처리 기술 기업 시스트란인터내셔널도 GPU 프라이빗 클라우드를 구축해 이용하고 있다. 시스트란은 딥러닝 솔루션과 크라우드소싱 휴먼 번역이 통합된 클라우드 기반 번역 플랫폼을 개발해 번역의 품질을 향상시킬 계획이다.

 
 

인텔 ‘제온 파이’, ASIC, FPGA 등도 주목
GPU가 이처럼 AI 인프라로서의 입지를 굳히며 선전하고 있는 가운데, ‘제온(Xeon)’ CPU로 데이터센터 시장을 독점하다시피 하고 있는 인텔은 AI 구현을 위한 인프라로 ‘제온 파이(Xeon Phi)’ 프로세서를 보유하고 있다.
엔비디아 GPU와 경쟁하는 최신 ‘제온 파이 나이츠랜딩’ 프로세서는 최대 72개 코어를 갖추고 있어, 딥러닝 등 AI 구현을 위한 연산 작업을 가속화한다. ‘제온 파이’ 기반 시스템은 최근 한국과학기술정보연구원(KISTI)이 구축사업자 선정을 마무리 지은 슈퍼컴퓨터 5호기에 탑재된다.
이와 함께 인텔은 지난해 6월 알테라 인수를 통해 FPGA 기술까지 확보했으며, 8월 인수한 너바나시스템즈의 AI 플랫폼 기술을 바탕으로 ‘제온 파이’의 개발 로드맵에 코드명 ‘나이츠 크레스트(Knights Crest)’를 추가하는 등 AI 부문을 위한 역량 강화에 본격 나서고 있다. 특히 인텔은 FPGA 기술을 궁극적으로 자사 프로세서에 통합함으로써 2020년까지 딥러닝 성능을 100배 높이겠다고 공언하기도 했다.
FPGA는 사용자가 용도에 맞춰 반도체의 설계를 변경할 수 있어, 프로그래밍에 따라 특정 알고리즘에 대한 가속기로 기능할 수 있다. 클럭 속도 향상의 벽에 부딪힌 기존 범용 프로세서에 비해 딥러닝과 같은 특정 용도에서 효율성이 높고 병목 현상이 적은 게 장점이다.
이미 MS도 ‘애저’ 클라우드 데이터센터에 FPGA를 적용하는 ‘프로젝트 캐터펄트(Project Catapult)’를 추진했으며, 구글과 아마존을 비롯해 중국 바이두와 알리바바, 화웨이 등까지 클라우드 서비스를 위한 데이터센터에 FPGA 기술을 활용하고 있다.
전 세계 FPGA 부문 1위 기업 자일링스(Xilinx)의 ‘버텍스 울트라스케일 플러스(Virtex UltraScale+)’ FPGA의 경우 AWS의 ‘EC2 F1’ 인스턴스에서 사용할 수 있으며, 자일링스 FPGA 기술은 알리바바 ‘F2’ 및 화웨이 ‘FACS FP1’ 인스턴스 등에도 채택됐다. 서버 제조사 중에서는 최근 델EMC가 FPGA 지원을 확대할 것이라고 밝히기도 했다.
한편 ASIC 활용 사례는 구글이 대표적이다. 구글은 최근 바둑계를 평정하고 은퇴한 AI 슈퍼컴퓨터 ‘알파고’에 자체 개발한 ASIC ‘TPU(Tensor Processing Unit)’를 사용했다고 밝혀 주목받은 바 있다.
 

▲ 구글 TPU

 
구글은 지난해 이세돌 9단을 상대로 승리한 ‘알파고 리(Lee)’ 버전에서 1세대 TPU 48개가 사용됐으며, 이후 최근 커제 9단을 누른 ‘알파고 마스터(Master)’ 버전은 같은 수의 TPU를 썼지만 CPU 수를 크게 줄였다고 밝혔다. 특히, 최근 기보 데이터 없이 바둑을 독학으로 깨치고 ‘알파고 마스터’를 격파했다고 발표해 주목받은 ‘알파고 제로’는 단 4개의 2세대 TPU만을 사용해 구동됐다고 한다.
구글에 따르면 2세대 TPU는 단일 모듈에서 최대 180TFlops에 달하는 연산 성능을 제공하며, 각 TPU에 포함된 맞춤형 고속 네트워크로 64개 TPU를 묶은 ‘TPU 팟(TPU pod)’ 슈퍼컴퓨터를 구성할 시 최대 11.5페타플롭스(PFlops)의 성능을 구현할 수 있다.
기존 최고급 상용 GPU 32개를 사용한 시스템에서 꼬박 하루가 걸리는 데이터를 학습할 때에도 ‘TPU 팟’의 1/8만 사용하면 반나절 만에 완료된다는 게 구글 측 설명이다. 이처럼 딥러닝 가속을 위해 GPU는 물론 FPGA와 ASIC까지 다양한 기술들이 본격적으로 발전하기 시작하면서, AI 시대는 하루하루 현실로 다가올 준비를 하고 있다.
<보안> SIEM 솔루션에 적용되는 지능정보 – 권정수 기자(kjs0915@itdaily.kr)
 
보안의 다양한 분야에서 지능정보에 관심을 보이고 있다. 특히, 많은 관심과 활발한 연구를 진행하는 분야는 SIEM으로, 인공지능, 머신러닝 등을 적용해 관제의 오탐을 줄이고 효율성을 높이기 위한 방법의 하나로 개발되고 있다. 주로 사용자 행위 기반 분석과 이상행위 탐지에 머신러닝이 적용돼 행동 범위를 파악하고 이를 벗어나는 경우 경보를 통해 관리자에게 알린다. 관리자가 직접 관제하는 범위를 좁힘으로써 관제의 효율성과 정확한 탐지율을 높인다는 것이다.
 
로그 수집에서 발전하고 있는 SIEM
보안 정보&이벤트 관리(Security Information & Event Management, SIEM) 솔루션은 보안과 관련된 일반 정보(로그인 내역, 정보 접근 내역 등)를 통합 관리해 사후 분석을 위한 용도로 사용되는 보안 정보 관리(Security Information Management, SIM)와 개별 보안 솔루션의 위협 탐지(IDS/IPS 탐지, AV 탐지 등)를 통합 관리해 침해 탐지 및 대응 용도로 사용되는 보안 이벤트 관리(Security Event Management, SEM)가 통합된 개념이다.
즉 SIEM은 기업 내 모든 장비에서 발생하는 로그 데이터를 한 곳에 수집·분석하는 로그 관리·분석, 보안 규제 준수 여부를 점검하는 컴플라이언스 준수, 보안 위협을 차단하기 위한 기업 보안 관리 도구를 하나로 합친 솔루션이다.
 

▲ SIEM은 보안장비의 로그를 수집해 보여주는 것으로 시작됐다.(이미지 출처: 테라바이트)

 
초기 SIEM은 보안장비와 IT 자산의 로그를 수집해 통합뷰를 제공하는 것으로 시작됐다. 이후 수집한 로그들에 대한 실시간 이벤트 연관성 분석을 통한 오탐을 낮추고 중요탐지에 대한 우선 처리를 가능하도록 하는 방향으로 발전됐다.
최근에는 개별 보안장비의 탐지 로그에 의존하는 위협 탐지 방식의 한계를 인지하고 보다 고도화된 탐지를 위해 트래픽 원본 수집, 엔드포인트 스캔 정보수집 등 다양한 정보를 능동적으로 수집하고 분석하는 방향으로 발전하고 있다. 이에 따라 네트워크 패킷 분석, 시나리오 기반 상관분석, 위협 인텔리전스, 머신러닝 등 다양한 기술과 기능이 접목되고 있다.
최근 SIEM에서 떠오르는 이슈로는 보안 전문가들의 전문적 지식과 경험에 기반한 위협 인텔리전스 확보를 꼽을 수 있다. 공격자들이 고도화된 공격을 지속적으로 감행하고 있는 만큼 전통적인 보안 솔루션 및 일회성 SIEM 솔루션 도입으로는 선제적으로 대응하기 어려워졌다. 이에 외부위협의 주체인 공격자 파악에 중점을 둔 위협 인텔리전스 확보의 중요성이 높아지고 있는 실정이다.
또한 실시간 연관성 분석을 위해 수집한 이벤트를 지속적으로 질의하는 경우 질의 속도 지연에 따른 탐지 지연이 발생한다는 문제도 일각에서 제기되고 있다. 이를 해결하기 위해 수집된 이벤트를 지속적으로 쿼리하는 대신 실시간 이벤트를 탐지엔진에 보내면서 분석하는 ESA(Event Stream Analysis) 기법을 도입하기도 한다.
업계에서 향후 SIEM분야의 전망은 두 가지로 나뉘고 있다. 긍정적인 전망은 기업전반에 걸친 가시성을 확보할 수 있고 최신 위협에 대한 선제적 대응이 가능한 SIEM 솔루션 도입이 더욱 활발해 질 것으로 예상하며, 방대한 위협정보를 수집·분석하고 비정상적 행동과 이상행위를 탐지·경고하는 대응 측면에서 인공지능과 미선러닝 기술이 큰 효과를 발휘할 것으로 전망하고 있다.
다른 전망은 기존 보안 솔루션들의 탐지로그를 수집하고 통합하는 수준의 탐지·대응은 많은 실패 사례를 통해 더 이상 유효하지 않다고 본다. 공격자 입장에서 시그니처 기반의 탐지 솔루션들을 우회할 수만 있다면 공격을 성공시킬 수 있기 때문이다. 따라서 보다 능동적인 탐지/모니터링 방식이 SIEM과 융합될 것으로 보고 있다. 대표적으로 모든 트래픽을 원본 단위까지 수집·저장·분석하는 네트워크 포렌식 분야, 엔드포인트 OS 내부에서 일어나는 행위를 수집·분석하는 엔드포인트 보안 위협 탐지 및 대응(EDR)분야가 융합돼 고도화된 보안 분석 체계를 제공하는 방향으로 발전할 것으로 전망했다.

 

지능정보와 SIEM 솔루션
보안위협을 탐지·대응하기 위해 SIEM 분야에 지능정보를 도입하고자 하는 움직임이 가속화되고 있다. 컴퓨터가 학습을 통해 인지·추론·학습 능력을 모방하고 스스로 사고 능력을 지속적으로 발전시키는 머신러닝 알고리즘 등을 도입, 매일 수만 건이 넘게 발생하는 대용량의 보안 데이터를 한정된 시간과 예산 내에서 분석하고 사용자가 우선적으로 해결할 이슈, 위협요소들을 보다 빠르게 인지하기 위해서다.
SIEM에 실시간 탐지를 위해 적용되는 이벤트 연관성 분석은 사전에 지정된 시나리오와 임계치에 기반한 탐지를 제공한다. 하지만 모든 공격에 대한 시나리오를 예측해 탐지 룰을 만들 수는 없기 때문에 많은 미탐이 발생하게 된다. 이를 보완하기 위해 사용자 행위 기반 분석(UBA) 기법을 사용하게 되며, 이를 구현하기 위해 인공지능과 머신러닝 기술이 사용되고 있다. UBA 기법은 대부분의 정상적인 사용자의 행동 범위를 파악하고 이를 벗어나는 행위를 하는 사용자가 있을 경우 경보로 알린다. 이 과정에서 인공지능·머신러닝 기술을 통해 사용자들의 행동 범위를 학습하고 이에 대한 정상/비장상 여부를 자동으로 판별하게 된다.
이런 기법 등과 보안관제 전문가가 오랜 기간 업무를 수행하며 축적한 정상/비정상적인 이벤트를 학습한 머신러닝 기반 시스템이 각종 보안장비에서 수집되는 방대한 데이터를 분석해 이중 정상적인 90% 이벤트를 걸러낸다면, 보안관제 전문가는 나머지 10%의 의심스런 이벤트만 집중적으로 분석함으로써 보안관제의 효율성을 높일 수 있게 된다. 이후, 시스템은 보안관제 전문가가 분석한 내용을 다시 학습하는 과정을 되풀이해 분석의 정확성을 높일 수 있게 된다.
또한 지능정보를 통해 관리자는 보안위협판단에 도움을 받을 수 있다. 지능정보가 위협 영향도를 판단해 가시화하거나 관련 조언을 통해 관리자의 판단에 영향을 줄 수 있다.

 

지능정보 적용 위한 연구 활발
많은 보안업체들이 자사 솔루션에 지능정보를 적용하기 위해 연구를 진행하고 있으며, 하나둘씩 제품을 선보이고 있다. 특히 SIEM 분야의 업체들이 지능정보가 도입된 솔루션을 선보이고 이와 관련된 연구를 활발히 진행하고 있다.
RSA는 자사의 ‘넷위트니스(NetWitness)’ 솔루션을 SIEM의 한계에 대응하는 ‘Beyond SIEM’의 방향을 제시하는 솔루션이라고 소개한다. 보안 로그, 이벤트 통합뿐만 아니라 트래픽 원본을 실시간으로 수집하고 분석하는 네트워크 포렌식 기술이 통합돼 동일한 데이터베이스(DB), 사용자인터페이스(UI)에서 로그 및 트래픽 정보를 통합·분석하고 이에 대한 실시간 연관성 분석을 제공한다. 또한 RSA의 EDR 솔루션 및 GRC 솔루션과 연계돼 엔드포인트 내부에서 일어나는 침해 행위에 대한 통합 분석, 기업의 비즈니스 정보와 연계한 분석이 가능하다.
 

▲ RSA ‘넷위트니스 스위트’

 
‘RSA 넷위트니스’는 보안 관제 인력의 경험을 바탕으로 공격을 탐지하는 방법을 연구해 이를 머신러닝 기법으로 구현한 솔루션이다. 이를 통해 사용자 인터넷 사용 행위를 학습해 대부분의 사용자와 다르게 행동하면 C&C 통신으로 의심되는 행위를 탐지한다.
이글루시큐리티는 ‘스파이더 TM V5.0(SPiDER TM V5.0)’을 다년간 축적된 보안 관제 노하우와 최적화된 업무 프로세스가 집약된 제품으로 설명한다. 이를 위해 많은 이벤트를 자동화해 처리하고 우선적으로 처리해야 할 이슈 및 위협 요소들을 직관적으로 인지할 수 있게 개발됐다. 또한 보안과제 업무에 최적화된 사용자 경험, 상관분석 시나리오 및 다양한 기관 기업에서 수집한 실시간 위협 인텔리전스를 제공해 최신 위협에 대응한다. 고도화되는 위협에 대응하기 위해 머신러닝 기반의 AI 알고리즘과 유관 기술을 더한 플랫폼 기술도 연구하고 있다.
안랩은 자체 개발한 ‘세피니피(Sefinify)’ 엔진을 안랩 관제센터에 적용해 보안관제 서비스를 제공하고 있다. 또한, 한국과학기술원(KAIST)과 보안관제에 머신러닝을 적용하는 연구를 공동으로 진행하고 있으며, 고도화된 보안 위협 탐지, 공격 유효성 검증 등 머신러닝 분석 기법을 연구해 적용하고 있다.
스플렁크(Splunk)는 빅데이터 환경에서 데이터를 수집하고 분석하는 엔진으로 유명하다. 이런 기능을 이용해 보안 솔루션에서 생성되는 머신 데이터를 수집하고 분석하려는 시도가 늘고 있으며, 스플렁크도 ‘스플렁크 엔터프라이즈 시큐리티’로 빅데이터를 활용해 SIEM 구축을 제안하고 있다. 스플렁크는 자사 솔루션에 머신러닝을 위협 예측 기술로 활용하고 있다. 이는 과거 데이터 위협을 학습해 모델을 만들고 변종 위협을 모델기반으로 찾는 방식이다. 스플렁크의 머신러닝 워크플로는 데이터 탐색, 모델 생성, 프로덕션 환경에 모델 적용, 모델 유효성 검사 순으로 단순화된다.
이 외에도 인공지능 기반의 지능형 보안관제 구축도 시도되고 있다. 대구광역시는 이글루시큐리티와 함께 ‘대구 AI 기반 지능형 보안관제 체계(D-Security)’ 구축 프로젝트를 진행하고 있다.
대구시는 안전한 지능정보 사회를 구현하고 지역의 IT 경쟁력을 강화할 수 있는 AI 기반 지능형 보안관제체계 구축을 목표로 하며, ‘D-시큐리티’는 ▲기존에 도입한 보안관제시스템(SIEM) ▲최신 위협 정보를 실시간으로 수집하는 ‘D-날리지 센터’ ▲자동으로 취약점을 진단해 선제 대응할 수 있는 ‘보안 취약점 자동진단 시스템’ ▲지속적인 반복학습을 통해 공격 패턴을 분석하는 머신러닝 기반의 AI 시스템 등이 상호 연계되는 형태로 구성될 계획이다. 이글루시큐리티는 ‘D-시큐리티’ 구축을 내년 1월까지 완료할 계획이며, 이를 위해 SIEM과 상호 연계되는 AI 예측 알고리즘을 개발하고 있다.
 

▲ 대구시의 AI 기반 지능형 보안관제체계 구축모델

 
다양한 보안 분야에 적용 기대
다른 보안분야에서도 지능정보에 높은 관심을 보이고 있다. 고도화되는 공격을 막기 위해 보안도 다양한 방법이 강구되고 있으며, 특히 사용자의 행위를 분석하거나 이상행위를 탐지하는 분야에서 머신러닝에 많은 관심이 모이고 있다.
지능정보는 보안관제 분야뿐만 아니라 다양한 분야에 접목이 가능하다. 우회접속탐지나 지능형지속공격(APT), 멀웨어 탐지에도 이용될 수 있으며, 위협 예측에도 활용할 수 있다. 많은 분야에 적용할 수 있는 만큼, 앞으로 지능정보가 보안에서 어떻게 적용돼 발전할지 기대된다.

 
[ 기사 원문 보기 – 아이티데일리 http://www.itdaily.kr/news/articleView.html?idxno=85783 ]