본문 바로가기

정보기술의 샘터........о♡/HCI·UX·UDL

컴퓨터와 인간의 만남 HCI

인간의 꿈
시간과 공간의 한계를 극복하기 위한 ‘인간의 꿈’은 IT기술의 지속적인 발전을 이룰 수 있는 밑거름이 되어 왔다. 그 예로 컴퓨터의 출현 이후 인간과 컴퓨터간의 자연스러운 상호작용, 즉 ‘휴먼 컴퓨터 인터렉션(HCI : Human Computer Interaction)’ 부문에서 다양한 시도가 이루어지고 있는 가운데, 음성을 통해 인간과 기계(컴퓨터)를 연결하고자 하는 음성인식(Speech Recognition) 기술, 음성합성(Speech Synthesis or Text-to-Speech) 기술, 기계가 인간의 일상적인 언어나 의사를 처리할 수 있게 하는 자연어처리(NLP : Natural Language Processing) 기술 등이 상당한 진척을 보이고 있으나 아직은 완전한 수준에 이르지 못하고 있다. 과거 HCI 기술에 대한 인간의 무한한 꿈은 기술적 한계에 부딪쳐 단순한 꿈으로 만족해야 했지만, 개발자들의 부단한 노력으로 꿈은 곧 세상을 바꾸는 힘이 되었고, 일부는 시스템 상용화 단계로 진일보하였다. 이는 Gartner의 자료를 통해 살펴볼 수 있는데, Gartner는 HCI 관련 기술인 NLP 검색 기술, 생체측정(Biometrics) 기술, 데스크탑 PC에서의 음성인식 기술, 콜센터에서의 음성인식 기술, 그리고 음성 합성 기술 등이 짧게는 2~5년 후, 길게는 5~10년 후 안정적인 시장 성장단계에 접어들 것으로 전망되고 있다.





휴머니즘을 담은 컴퓨터
 HCI 관련 기술들의 단계적 특성을 살펴보면, NLP 검색 기술은 향후 유망한 IT기술로 서서히 두각을 나타내고 있는 단계에 있으며, Biometrics 기술은 현재 가장 큰 관심의 대상이 되는 IT 유망기술 단계, 음성인식 및 음성합성 기술은 단순한 관심의 대상에서 한단계 더 기술적으로 성숙하여 어느 정도 시장성이 확보되기 시작하는 단계에 머물고 있는 것으로 분석되고 있다.지난 20년 동안 컴퓨터와 인간의 상호작용을 위한 사용자 인터페이스(UI : User Interface) 기술은 초기 텍스트 위주의 UI에서 그래픽으로, 입력장치도 키보드에서 마우스와 펜 등으로 다양해졌다. 일일이 명령어를 외어 입력하는 캐릭터 UI 보다는 ‘아이콘’이라불리는 그림 문자를 마우스로 클릭해 조작하는 GUI 즉, WIMP(Windows, Icons, Menus, and Pointing device)를 통해 훨씬 배우기 쉽고 빨리 인식할 수 있게 되었다. WIMP는 웹 브라우저와 결합되어 PC는 물론 이동통신단말기 및 각종 디지털 가전들을 통해 우리의 IT에 대한 기본 욕구를 충족시켜왔다.향후 10년 동안 IT 기술이 더욱 고도화되고 기능이 복잡할수록 사용성(Usability) 문제가 커질 것이며, IT 기술의 생활화를 이끌 사용자 인터페이스는 휴먼 수준(Human Levels)에 가까운 입력 기술, 디스플레이 기술, 프리젠테이션 기술 등의 발전에 달려있다고 전문가들은 전망하고 있다. 컴퓨터의 출현 이후 인간과 컴퓨터간의 상호작용은 “종이(펀치카드) ?? 문자입력기(키보드) ?? 그래픽 인터페이스(GUI)”로 발전해왔다. 여기서 향후 컴퓨터와 인간이 서로 대화하는 것 같은 느낌을 갖게 되는 보다 인간중심적인 컴퓨팅 환경을 구축할 수 있는 차세대 HCI 관련 유망기술인 음성인식 기술, 음성합성 기술, 자연어처리 기술 및 시장 동향에 대해 살펴보기로 한다.





 음성인식
지난 70년대에 태동된 음성인식 기술은 사람의 기본적인 의사소통 수단인 ‘말(언어)’을 통해 보다 편리하고 인간적인 방식의 컴퓨팅 환경을 구축하기 위한 기반 기술이다. 즉, 지금까지는 인간의 사고를 컴퓨터 및 각종 정보기기에 접목시키기 위해 키보드나 마우스 등과 같은 물리적 장치와 WIPM가 맡아왔지만, 앞으로는 인간의 음성이 이를 대신할 수 있게 된다는 점에서 음성인식 기술은 진정한 휴먼 인터페이스 컴퓨팅 환경을 열어갈 것으로 전망되고 있다. 또한 음성인식 기술의 발전을 통해 IT기술의 새로운 장이 열릴 것으로 기대되고 있다. 본 장에서는 음성인식 기술의 개요와 음성인식 기술의 응용, 그리고 표준화 동향을 살펴보기로 한다. 사람의 음성 신호를 인식하는 기술은 크게 ‘음성인식’과 ‘화자(speaker)인식’으로 나뉜다. 음성인식은 인간의 음성을 기계나 컴퓨터에서 자동으로 인식하는 것으로 일반적으로 음성 신호로부터 음소 텍스트(발성된 문자열)을 인식하고 출력할 때까지를 음성인식이라고 부르는 경우가 많다. 한편 넓은 의미에서는 말하는 사람(화자)의 인식과 자연어처리를 포함한 음성 이해와 의미 추출까지를 포함하기도 한다. 이러한 음성인식 시스템은 특정 화자를 인식하는 ‘화자종속’ 시스템과 화자와는 상관없이 이뤄지는 ‘화자독립’ 시스템으로 다시 분류된다.


음성인식 기술
음성인식의 처리는 입력된 음성 신호를 음향적으로 분석하는 부분, 분석에 의해 얻어진 파라미터(특정량)로부터 음소 등의 작은 단위에 대한 유사도를 계산하는 부분, 몇 개의 음소를 최적에 배열하고 단어와 문장으로서 후보를 출력하는 부분으로 구분된다. 바야흐로 음성인식 기술은 사람의 말이 무엇을 가리키는지 ‘인식’하는 수준에서 이제 뜻을 ‘이해’하고 ‘의도’를 분석하는 단계로 접어들고 있다. 그러나 이러한 음성인식 기술의 보급이 아직까지 미흡한 이유는 크게 두 가지로 나눌 수 있다. 첫째, 기술이 실용화하기에 충분한 수준으로 발전하지 못했기 때문이다. 응용분야에 따라 차이가 있으나 음성인식을 실용 제품에 사용하려면 인식률이 95% 이상 돼야 한다. 그러나 사람이 자유롭게 말하는 것을 95% 이상 인식하는 것은 현재로서는 불가능하다. 둘째, 현재까지 개발된 기술을 실용시스템에 접목하는 기술이 부족하다는 점이다. 응용분야별 음성인식 요구사항이 무엇인지, 또 음성인식을 사용자 인터페이스로 사용할 때 어떤 방식을 사용해야 효과적인지 등의 연구가 미진하기 때문이다. 음성인식 기술은 현재 컴퓨터의 성능향상과 인터넷의 발달로 무궁무진한 응용분야로 확대되는 추세이며, 관련 연구개발(R&D) 방향도 음성인식 기술에 대화처리와 언어모델 연구 등으로 다변화되고 있다.





음성인식 솔루션
현재 개발 중이거나 개발된 음성인식 솔루션들은 IT산업의 모든 분야와 접목을 시도하고 있다. 음성구동 컴퓨터를 비롯 음성인식을 기반으로 하는 자동 내선 교환기(내선번호를 누르지 않고 음성만으로 교환원 없이 원하는 사람이나 부서를 연결 해주는 교환 시스템), 음성포털, 통합메시징도구, 그룹웨어, 차량항법시스템, 자동번역시스템, 각종 정보단말기 등에 광범위하게 적용되고 있으며, 말을 문자로 변환시켜주는 ‘음성타자기(딕테이션)’, 다시 말로 바꿔주는 ‘번역기’ 등은 시제품 단계에 이르렀다.이밖에 의료분야에서 음성인식 기술의 응용이 활발하게 이루어지고 있는데, 환자의 입원에서부터 진료기록, 진료의사결정, 진료결과, 병원비정산 등에 이르기까지 광범위하게 응용되고 있다. 최근 2년동안 음성인식 기술은 상당한 발전을 이루었으며, 이제부터는 광범위한 기업 애플리케이션에 성공적으로 응용 및 채택되어야 할 단계에 이르렀다. 또한 기업들도 각자의 비즈니스 목적에 맞는 애플리케이션 개발에 있어서 음성인식 기술을 어떻게? 잘? 활용할 것인가에 대해 고민해야할 시기가 되었다. Gartner는 향후 모바일 및 데스트탑 PC 운용시스템(Operating System)에서 음성인식 기술이 채택될 것으로 전망하고 있는데, 2005년까지는 모바일 OS에 음성인식 기술이 채택될 것이며, 2010년까지는 차세대 사용자 인터페이스의 핵심 기술로 음성인식 기술이 차지할 것으로 전망되고 있다.





음성기술시장
최근 음성 관련 기술시장은 텔레포니 기반의 음성기술시장은 기업고객 위주로 그 성장이 더딘 반면, 임베디드칩 시장은 일반고객들을 상대로 다양한 분야에 음성기술을 접목하면서 급성장하고 있다. IDC의 2001년 11월 발표자료에 따르면, 2000년 전세계 텔레포니 음성처리 소프트웨어(Telephony Speech Processing Software) 시장규모는 약 4억 3,640만 달러며, 2005년까지 연평균복합성장률(CAGR) 52.1%로 성장하여 2005년에는 시장규모가 약 35억 4,890만 달러로 성장할 것으로 전망하고 있다. IDC는 텔레포니 음성처리 소프트웨어 시장을 크게 자동음성인식(ASR : Automatic Speech Recognition) S/W 시장과 음성합성(TTS : Text-to?Speech) S/W 시장, 그리고 화자인식(VR : Voice Recongnition) S/W 시장 등으로 구분하고 있다. 이들 소프트웨어의 2000년 시장 규모를 살펴보면 음성인식 S/W 시장이 전체 시장의 93.1%에 해당하는 4억 640만 달러였으며, 음성합성 S/W 시장이 전체 시장의 6.3%에 해당하는 2,750만 달러, 그리고 나머지 화자인식 S/W 시장이 전체 시장의 0.6%에 해당하는 250만 달러에 달한 것으로 IDC는 전망하고 있다. 향후 2005년 전세계 텔레포니 음성처리 소프트웨어 시장규모는 약 35억 4,890만 달러에 이를 것으로 예상되고 있는 가운데, 이를 분야별로 세분화하여 살펴보면, ASR S/W 시장이 전체의 96.2%를 차지해 음성처리 S/W 시장을 석권할 것으로 전망되고 있으며, 그 뒤를 이어 음성합성 S/W 시장이 3.1%, 화자인식 S/W 시장이 0.7%를 차지할 것으로 전망되고 있다. 




 1위 필립스
주요 벤더별 매출액 및 시장점유율 현황을 살펴보면, 지난 2000년 Philips Speech Processing이 약 5,500만 달러의 매출을 올려 전체 시장의 12.6%를 차지해 업계 1위를 차지하였으며, 그 뒤를 이어 Nuance Communications가 매출액 5,190만 달러로 시장점유율 11.9%를, Periphonics/Nortel Newtorks가 매출액 3,880만 달러로 시장점유율 8.9%를, SpeechWorks International이 매출액 3,040만 달러로 시장점유율 7.0%를, L&H가 3,000만 달러로 시장점유율 6.9%를 각각 차지하였다. 지역별 텔레포니 음성처리 소프트웨어 시장규모를 살펴보면, 2000년 전체 시장규모의 67.5%(약 2억 9,470만 달러)를 북미가 차지하였으며, 그 뒤를 이어서 서유럽이 13.3% (약 5,820만 달러), 남미가 6.6%(약 2,870만 달러), 아시아/태평양 지역이 4.7%(약 2,070만 달러), 일본이 4.3%(약 1,900만 달러)를 차지했으며, 향후 2005년에는 북미의 비중이 46.2%로 감소한 반면, 서유럽은 23.3%, 남미는 10.9%, 아/태 지역은 7.9%, 일본이 6.8% 등으로 시장 비중이 각각 확대될 것으로 전망되고 있다. 음성인식 관련 표준을 살펴보면 VoiceXML, CCXML(Call Control XML), SALT (Speech Application Language Tags) 등이 있으며, 이들 표준에 대해 간단히 살펴보면 다음과 같다. 유무선 전화와 PC 기반의 인터넷 환경을 통합한 신개념의 서비스인 음성포털(Voice Portals : 현재 널리 쓰이는 증권정보 및 예약정보, 뉴스 등 각종 콘텐츠를 PC와 유무선 전화로 자유롭게 받아볼 수 있는 서비스)에서 사용되는 VoiceXML은 XML에 기반을 둔 Markup language로서, HTML이 graphical web page를 만드는데 사용되는 것처럼 VoiceXML은 spoken dialog를 정의하는데 사용되는 언어이다.


 

표준화 동향

적용 가능 분야는 UMS (Unified Messaging System), ASR(Automatic Speech Response) 같은 음성 관련 서비스 분야에 사용될 수 있다. VoiceXML은 AT&T, 루슨트 테크놀로지스, 모토롤라 등으로 구성된 VXML 포럼(Forum)에서 제시한 대화형 음성 서비스의 인터넷 기반 개발을 위한 문서형 인터페이스로 XML spec 1.0 에 기초하며 다이얼로그, 문법, 이벤트, 오디오 출력, 오디오 입력, 콜 제어, 흐름 제어 등에 관련된 엘리먼트들로 구성된다. CCXLM(Call Control XML)은 최근 W3C 표준화기구에서 IP 기반의 음성 서비스에 있어서 호 제어를 효율적으로 기술할 수 있는 Markup 언어의 표준화가 진행되고 있으며, 앞서 살펴본 VoiceXML를 보완할 수 있는 표준이다. SALT(Speech Application Language Tags)는 플랫폼에 독립적인 개방형 표식 언어로 음성 인터페이스를 통해 접속할 수 있는 애플리케이션의 개발을 가능하게 하며 정보기술, 애플리케이션, 웹 서비스에 적용될 수 있으며, 이러한 서비스는 PC나 전화, PDA 등과 같이 다양한 디바이스에 접속해 사용할 수 있다. SALT를 사용하면, 기존의 툴과 기술을 사용해 웹 콘텐츠에 내장되어 있는 음성 기능을 더욱 향상시킨다. 즉, SALT는 xHTML과 같이 현존하는 표식 언어의 하위그룹으로 웹 콘텐츠에 음성인식, TTS(text-to-speech), 콜 컨트롤 기능을 추가할 수 있다. 또 핵심 언어의 사양을 특정 기기 기능의 프로파일과 결합시키는 고유의 구조를 갖고 있으며, 현재 보편화된 음성 엔진 및 웹 개발 툴과 함께 사용될 수 있도록 만들어졌다. SALT 포럼(시스코, 인터넬, 마이크로소프트, 필립스, 스피치웍스 등 23개의 업체들이 참여)은 2002년 상반기 중에 초안적인 기능의 시험 서비스를 테스트한 후, 그 결과를 표준화 기구에 제출할 계획이다.





 음성합성 기술
음성인식과 더불어 음성 기술시장에서 큰 비중은 차지하고 있는 분야는 음성합성분야로, 음성합성(Text-to-Speech or Speech Synthesis)이란 문자그대로 글(text : ASCII text 혹은 Machine-readable text)을 말(speech)로 바꾸는 기술이다. 일반적으로 자동응답시스템(ARS)에서 듣는 기계음의 목소리는 대부분 음성합성 기술을 활용해 제공되는 정보이다. 최근에는 음성합성을 이용해 인터넷 신문의 기사를 읽어주는가 하면, e-mail 읽어주기, 음성포털, 게시판 및 전자책, 가전제품, 개인휴대단말기(PDA)와 이동전화 등 가정과 산업의 다방면에서 그 쓰임이 늘어나는 추세다. 음성합성 기술이 상용화되기 시작한 것은 오래되었지만, 기계적인 목소리에 대한 거부감으로 시각장애인용과 같이 극히 제한적으로 이용되었다. 그러나 최근에는 인간의 자연음에 가까운 음성합성기가 개발되어 비정서적인면은 많이 개선되었는데, 이러한 음성합성기는 스튜디오에서 녹음된 10∼40시간 분량의 목소리를 여러 조각으로 나눠 데이터베이스로 분류하고 소프트웨어가 텍스트를 처리할 때는 음성을 추출한 뒤 재합성해 새 문장을 만들어낸다. 음성합성 기술의 주요 응용분야를 살펴보면, 금융권을 비롯한 서비스업에서 고객이 다양한 통신수단(웹, e-mail, 팩스, 전화, 휴대폰 등)을 통해 접촉하더라도 모두 다 수용하여 고객과 상담원 사이의 거리를 최소화할 수 있는 지능형 콜센터의 구축이 늘고 있으며, 이러한 지능형 콜센터에 대한 요구가 높아지면서 음성 기술에 대한 관심도 증폭되고 있다. 이는 음성인식 기술과 음성합성 기술 등을 적용해 고객의 접촉편의를 높이는 한편 콜센터 운영에도 효율을 기할 수 있기 때문이다.





 고객에 일대일 대응
음성합성 기술은 수시로 변할 수 있는 정보에 대해 일일이 고객 대응이 어려운 부분에 적용할 수 있다. 이 경우 텍스트를 음성으로 변환해 읽어주는 음성합성은 이 같은 고객 대응의 문제를 단번에 해결해줄 수 있다. 또한 음성합성 기술의 진보에 따라 증권조회 서비스?은행 콜센터의 잔액 조회 서비스?항공사의 고객 관리(예약정보?항공정보) 서비스 등에 음성합성 기술의 응용이 점차 확대되고 있다. 콜센터 이외에 음성합성 기술이 응용되고 있는 분야로는 e-mail 음성서비스, In-car 시스템(실시간 교통정보, 교통상황을 반영한 운자자 네비게이션 서비스), Assistive 서비스(시각 및 청각장애인을 위한 서비스), Consumer 제품(전자사전, 자동번역기, 장난감, 게임 등), Proofreading(타이핑된 문서의 오타 확인을 위한 Reading) 등이 있다.음성합성 관련 제품의 벤더들을 살펴보면, Centigram과 AcuVoice, DECTalk와 같은벤더들은 1999년에 각자의 분야에서 어느정도 시장점유율을 확보하였으며, 이후 신규 벤더들이 지속적으로 음성합성 기술 시장에 진출하고 있으며 시장규모도 지속적으로 성장하고 있다. 음성합성 제품의 가격은 현재 포트당 400~800달러 선이며, Rhetorical Systems나 AT&T Labs과 같은 벤더들은 주문형(기업의 CEO 음성, 10대들이 좋아하는 연예인의 음성, 만화 캐릭터의 음성 등) 음성합성 제품을 판매하고 있는데, 여기에는 약 15만 달러의 비용이 추가된다. 현재 해외 음성합성 벤더인 SpeechWorks와 Nuance 등이 한국에 지사를 세우고 영업을 하고 있으나 시스템 안정성이나 고객 지원, 국내에서의 상용화 경험 등에서 코아보이스(www.corevoice.com), 보이스텍(www.voicetech.co.kr), HCI랩(www.hcilab.co.kr), 보이스웨어(www. voiceware.co.kr) 등과 같은 국내업체들을 따라오기는 역부족인 것으로 분석되고 있다.음성합성 S/W 시장을 애플리케이션별로 구분하여 살펴보면, 크게 IVR(Interactive Voice Response)와 Operator Services, Messaging 등으로 나눌 수 있다. IDC의 자료에 따르면 지난 2000년 음성합성 S/W 시장에서 IVR이 차지하는 비중은 50.9%로 가장 크고,그 뒤를 이어 Operator Services가 29.5%를, Messaging이 19.6%를 각각 차지하였다. 




 자연어처리 기술
고객이 원하는 제품에 대한 정보를 빠르고, 간편하게 얻을 수 있는 것은 바로 판매자의 매출과 직결되는 중요한 문제이다. 따라서 고객상담원을 통한 전화기반 정보서비스는 고객에게 친밀감과 원하는 정보를 즉시에 제공할 수 있는 장점이 있는 반면, 판매자입장에서는 초기 구축 비용과 유지비용이 문제가 된다. 이를 해결하기 위해 키워드(Keyword) 기반의 웹 검색시스템을 구축하면 상대적으로 적은 비용이 소요되는 반면 때때로 부정확하고, 장황하고, 혼란스러운 검색결과가 나오는 문제점이 있다. 이러한 딜레마를 해결하기 위해 자연어처리 기반 검색 기술이 이용되고 있다. 자연어처리(NLP : Natural Language Processing) 기술은 컴퓨터가 사람의 일상 언어를 이해하고 생성할 수 있도록 함으로써 인간의 지적 활동의 보조자 및 지원도구로 활용하고자 하는 기술이며, 사람들이 특별하게 포맷된 언어나 명령어 없이도 컴퓨터와 교류할 수 있게하는 기술이다. 또한 NLP 기반 검색 기술은 인터넷 상에 존재하는 정형, 비정형 데이터베이스내의 정보를 인간의 일상 언어 문장을 통해 제공하는 정보 제공 기술이다. 최근에는 음성인식 기술과 결합한 자연어처리 기술이 상용화되고 있는데, 음성인식과 자연어처리 기술이 조합된 구어체시스템은 사용자들이 정보검색 작업을 위해 음성명령으로 데이터베이스를 조회할 수 있도록 해준다. 그러나 화자를 가리지 않는 높은 정확성과 많은 어휘를 갖춘 구어체시스템은 막대한 하드웨어시스템을 요하기 때문에 가격이 비싸지만 컴퓨터의 가격대비 성능의 개선으로 앞으로 몇년간 상용화가 더욱 가속화될 전망이다.





 강력한 컴퓨터시스템 기대
특히 점차 강력해지는 데스크톱 시스템은 주변 잡음, 음향학상으로 비슷한 단어 구분, 화자의 변화 등과 같은 기술적인 난제를 해결해줄 것으로 기대되고 있다. 1990년대 중반 NLP 기반 검색솔루션이 등장했을 당시, 정보전문가들을 초보적이고 원시적인 검색솔루션에 대한 믿음이 적었고, 급속한 기술 발전이 이루어진 지금까지도 대부분의 정보전문가들은 키워드 기반의 정보검색 방법을 더 선호하고 있다. 이는 향후 NLP 기반 검색솔루션의 나아갈 바를 시사하고 있다. 즉, 사용자가 복잡한 Query 언어를 배울 필요가 없고, 문맥에 따가 정밀도가 높은 검색 결과를 얻을 수 있는 장점에도 불구하고, 정보검색을 위한 도메인 영역이 좁고, 새로운 도메인 추가시 많은 비용이 소요되고, 자연어의 복잡성으로 인한 잘못된 해석과 정확도 결여 등의 해결해야할 과제가 존재하고 있다. 지난 1999년과 2000년 Applied Semantics, Ask Jeeves, DolphinSearch, YY Technologies, Electric Knowledge, LexiQuest, iPhrase Technologies 등과 같은 NLP 관련 신생 벤더들의 진출로 많은 NLP 검색 솔루션들이 출시되었다. 이는 당시에 인터넷 및 모바일 기술이 지속적으로 성장하였고 새로운 사용자 인터페이스에 적당한 정보검색 기술로 평가받았기 때문에 시장 여력이 충분하였고, 또한 당시에 막대한 벤처 자금이 인터넷 기업들에 유입되었기 때문이다. Gartner는 현재 약 50~100개의 NLP 검색 엔진 벤더들이 Autonomy, Lotus, Verity, Convera 등과 같은 정보검색 업체들에 의해 인수/합병의 단계를 거쳐 2003년에는 5~10개 업체로 정리될 것으로 전망하고 있다.





차세대 사용자 인터페이스
현재 Microsoft, IBM, 애플컴퓨터, 노키아, 모토롤라 등의 해외 선진기업들은 사용자 인터페이스 전문인력들을 통해 UI 기반기술에서 응용분야까지 광범위한 연구를 수행하고 있다. 특히, Microsoft 사는 NISD(Natural Interaction Services Division)라는 부서를 통해 차세대 사용자 인터페이스(일명 NUI : Nautral User Interface)에 대한 개발을 담당하고 있는데, Microsoft사의 대표 브랜드인 Office, Windows, MSN, Tablet PC 등의 주요 컴포넌트들을 개발해오던 NISD에서는 자연어처리, 음성인식, 음성합성, 필기체인식(Handwriting Recognition) 등의 HCI 관련 유망기술을 활용하여 350여 명의 연구원들이 NUI를 개발하고 있다. 마찬가지로 국내에서도 삼성전자와 LG전자와 같은 주요 IT기업들이 UI 혁신 작업에 전사적으로 나서고 있다. 이는 국내외 선진 IT 기업들이 인간과 컴퓨터, 인간과 인터넷의 상호작용 및 의사소통 구조를 고민하지 않고서는 미래의 IT 환경에서 살아남을 수 없다는 인식이 확산되고 있기 때문이다. 바로 이러한 인간중심적인 컴퓨팅 환경을 구축할 수 있는 차세대 사용자 인터페이스의 중심에 음성인식 기술, 음성합성 기술, 자연어처리 검색 기술 등과 같은 HCI 관련 유망기술이 있으며 지속적인 기술개발이 필요하다고 할 수 있다. 이상으로 21세기 디지털 산업의 핵심 경쟁요소로 떠오르는 HCI 관련 유망기술인 음성인식, 음성합성, 자연어처리 검색 기술과 시장 동향 등에 대해 살펴보았다.


IT 유망기술 보고서
소프트웨어 및 솔루션 유망기술
http://www.itfind.or.kr/IITA/Report/book/2002_Technology_3-1.pdf



                          
                                                        E.T 영화음악

출처 : http://kr.blog.yahoo.com/dehongsu2000/1418