2024 | 04 | 16
18.8℃
코스피 2,609.63 60.8(-2.28%)
코스닥 832.81 19.61(-2.3%)
USD$ 1394.0 5.5
EUR€ 1479.9 4.9
JPY¥ 903.0 2.8
CNY¥ 191.7 0.4
BTC 95,174,000 3,363,000(-3.41%)
ETH 4,638,000 209,000(-4.31%)
XRP 745.3 22.2(-2.89%)
BCH 733,300 102,600(-12.27%)
EOS 1,125 77(-6.41%)
  • 공유

  • 인쇄

  • 텍스트 축소
  • 확대
  • url
    복사

AWS, 신규 아마존 AI 서비스 3종 발표

  • 송고 2016.12.05 16:34 | 수정 2016.12.05 16:34
  • 강승혁 기자 (kang0623@ebn.co.kr)

아마존 렉스·폴리·리코그니션 출시

이미지 분석·사람 얼굴·물체·특정 장면 등 인식 애플리케이션 개발 가능

아마존웹서비스(이하 AWS)는 5일 아마존 렉스(Amazon Lex), 아마존 폴리(Amazon Polly), 아마존 리코그니션(Amazon Rekognition) 등 3개의 신규 AI(Artificial Intelligence) 서비스를 출시한다고 밝혔다.

이번에 새롭게 발표된 서비스를 통해 개발자들은 자연어를 인식하고 텍스트를 실제 사람의 말과 같은 음성으로 바꿔주며 음성이나 텍스트를 통해 대화를 진행하거나 이미지 분석, 사람의 얼굴이나 물체, 특정 장면 등을 인식하는 애플리케이션을 개발할 수 있다.

AWS의 AI 서비스는 아마존이 모든 관리 서비스를 제공해 별도의 알고리즘을 구축하거나, 머신 러닝 모델을 트레이닝할 필요가 없다. 선지불(up-front commitments)이나 인프라 투자를 필요로 하지 않는다.

아마존 렉스는 대화형 인터페이스 구축을 위한 새로운 서비스로, 아마존 '알렉사'에서 사용되는 것과 동일한 자동 음성 인식 기술(ASR) 및 자연어 처리 기술(NLU) 기술을 기반으로 음성과 텍스트를 이용한다. 거의 모든 앱에서 복잡한 자연어 처리 기능을 가능하게 한 것이다.

개발자들은 아마존 매니지먼트 콘솔에서 봇을 생성해 간단한 어구를 타이핑 해 시험해 볼 수 있다. 해당 과업을 수행하는 데 필요한 추가적인 매개 변수를 얻기 위해 지시를 내릴 수도 있으며 그에 해당하는 상세한 정보를 위한 질문을 받기도 한다. 이후부터는 아마존 렉스가 언어 모델을 구성하고 추가적인 질문을 제시해 주어진 과업을 완수한다.

아마존 렉스는 AWS 람다(Lambda)와 통합돼 있다. 개발자들은 AWS 람다 기능을 사용해 적절한 백엔드 서비스를 아마존 렉스로 불러 오도록 설정할 수 있다.

또 세일즈포스, 마이크로소프트 다이나믹스, 마케토, 젠데스크, 퀵북, 허브스팟 등의 엔터프라이즈 시스템에서 데이터를 불러와서 '세일즈포스에서 내 상위 10대 계정이 무엇인가'와 같은 질문에 답하도록 AWS 람다(Lambda) 기능을 수행하는 사전 구축된 엔터프라이즈 커넥터를 사용할 수 있다.

아마존 렉스를 사용해 구축한 봇은 웹 애플리케이션부터 페이스북 메신저나 슬랙 등의 채팅 및 메신저 앱을 비롯해 모바일 또는 커넥티드 디바이스의 음성을 통해 어디서든 사용 가능하다.

아마존 렉스는 트래픽이 증가함에 따라 자동으로 확장이 이뤄지기 때문에 개발자들은 인프라 확장에 대해 걱정하지 않고 아마존 렉스 API 호출에 따른 비용만 지불하면 된다.

아마존 폴리는 개발자로 하여금 사람의 음성과 같은 자연스러운 음성 출력 기능을 신문 읽기 앱이나 이러닝 플랫폼 등 기존의 애플리케이션에 쉽게 추가할 수 있도록 한다. 또는 이를 통해 모바일 앱, 디바이스, 애플리케이션 등의 분야에서 전혀 새로운 종류의 음성 지원 제품을 개발할 수 있다.

개발자들은 아마존 폴리에게 SDK를 사용하거나 AWS 관리 콘솔에서 메시지를 보낼 수가 있으며 폴리는 즉각 음성으로 이를 출력한다. 출력되는 음성은 바로 재생 가능하고 표준 오디오 파일 형식으로 저장할 수 있다.

전 세계 24개 언어로 47개의 실제와 같은 음성을 제공하는 폴리를 통해 개발자들은 성별, 억양 등을 자유롭게 선택해 전 세계 사용자들을 대상으로 하는 애플리케이션을 개발할 수 있게 된다.

아마존 폴리는 확장성이 뛰어나며 대량의 음성 변환 작업에도 고품질의 음성을 빠른 속도로 출력한다. 개발자는 변환되는 텍스트의 양 만큼만 비용을 지불하면 되고 생성된 음성 파일은 저장 후 자신이 원하는 만큼 아무런 제약 없이 재생할 수 있다.

아마존 리코그니션은 개발자들이 빠르고 손쉽게 이미지를 분석하고, 안면이나 사물, 장면 등을 인식하는 애플리케이션을 개발할 수 있도록 해 준다. 딥러닝 기술을 이용해 자동으로 차량이나 애완동물, 가구 등 사물과 장면을 식별한 후 신뢰도 점수를 제공한다.

이를 통해 개발자들은 이미지에 태그를 적용해 애플리케이션 사용자들이 키워드를 통해 이미지를 검색할 수 있게 한다.

이미지 내에서 얼굴을 인식하고, 웃고 있는지, 눈을 감았는지 등의 속성을 감지해 낸다. 또한 고급 안면 분석 기능을 제공해 안면 비교나, 안면 검색 등도 수행할 수 있다.

이를 이용해 개발자들은 동일 인물을 촬영한 두 개의 이미지를 놓고 안면의 유사성을 측정할 수 있으며 거의 실시간으로 참고 사진과 대조해 사용자의 신원을 검증할 수 있다.

수 백만 장의 얼굴 이미지(사진에서 탐지)를 모을 수도 있고 기준이 되는 얼굴을 데이터베이스에서 검색할 수도 있다. 고가의 이미지 처리 시스템을 구축하고 관리하는 데에 소요되는 복잡성과 오버헤드를 줄여 준다.

아마존 리코그니션 사용 시 선투입 비용(upfront costs)은 발생하지 않으며 개발자는 저장하는 안면 형태 벡터 및 분석 이미지의 양에 따라 비용을 지불하면 된다.

아마존 폴리는 미국 동부 지역(북 버지니아), 미국 동부(오하이오), 미국 서부(오레곤), 유럽(더블린) 지역에서 바로 이용 가능하며, 향후 수 개월 간 서비스 지역을 넓혀 나갈 예정이다.

아마존 리코그니션은 미국 동부(북 버지니아), 미국 서부(오레곤), 유럽(더블린) 지역에서 이용이 가능하며 향후 수 개월 간 다른 지역으로 서비스 지역을 확대할 예정이다. 아마존 렉스는 현재 프리뷰를 이용할 수 있다.

이 서비스들에 더해 AWS는 최근 오픈소스로 배포되는 딥 러닝 프레임워크인 MXNet에 대규모 투자를 단행한다고 발표했다. 카네기 멜론 대학 등 유명 대학 연구진에 의해 최초로 개발된 MXNet에 대해 Amazon은 코드 기여 및 개발자 환경 개선 등을 진행해 왔다.

AWS의 데이터베이스, 애널리틱스 및 AI 담당 부사장인 라주 굴라바니는 "AWS는 그간 혁신의 근간 기술을 모든 개발자들이 공유할 수 있도록 3가지 종류의 관리형 Amazon AI 서비스를 출시하게 됐다"며 "앞으로 고객들이 어떻게 아마존 렉스, 아마존 폴리, 아마존 리코그니션을 사용해 인간과 같은 지성을 지니고 사람처럼 보고, 듣고 말하며, 인간 및 주변 환경과 상호작용할 차세대 앱을 어떻게 개발할지 매우 기대된다"고 말했다.


©(주) EBN 무단전재 및 재배포 금지

전체 댓글 0

로그인 후 댓글을 작성하실 수 있습니다.

시황

코스피

코스닥

환율

KOSPI 2,609.63 60.8(-2.28)

코인시세

비트코인

이더리움

리플

비트코인캐시

이오스

시세제공

업비트

04.16 17:29

95,174,000

▼ 3,363,000 (3.41%)

빗썸

04.16 17:29

94,753,000

▼ 3,635,000 (3.69%)

코빗

04.16 17:29

94,870,000

▼ 3,587,000 (3.64%)

등락률 : 24시간 기준 (단위: 원)

서울미디어홀딩스

패밀리미디어 실시간 뉴스

EBN 미래를 보는 경제신문