본문 바로가기

고이군 IT뉴스

시멘틱 웹

유비쿼터스 컴퓨팅의 미래형 웹, 시멘틱 웹(Sementic Web)

                                                                                                                 글. 정기욱(kiwook@unnovation.net)

시멘틱 웹이란

유 비쿼터스 컴퓨팅은 결국은 가상의 통로를 사용하여, 정보 제공, 공유를 하게 될 것이라고, 예측한다. 그런 의미에서 현재의 웹이 지니는 의미는 대단하다고 말 할 수 있다. 지금은 지식정보 사회라고 흔히들 말한다. 그 만큼 지식의 정보는 가치가 있다는 것이다. 유비쿼터스 컴퓨팅은 단순히 사회와 인간을 매개 할 수 있는 매개 정보 도구라고 이해할 수도 있다. 결국 궁극적인 목적은 인간이 사회 생활을 하는데 있어서 효율성을 높이기 위해 돕는 도구의 개념이다. 그런 의미에서 미래에는 정보를 표현하는 방법론, 정보를 비교하여, 그 가치를 판단하는 기준을 확보하는 것이 매우 중요하다. 유비쿼터스 컴퓨팅은 정보를 가공하고 효율적으로 분배/취합하는 능력을 갖게 될 것이다.


시멘틱 웹 소개

시멘틱 웹에 대한 소개와 관련 내용은 The MIT Press에서 출간된 "A Semantic Web Primer"의 내용을 참고하게 될 것이다. www, 즉 우리가 정보를 접하기 위한 경로 역할을 하게 된다. 또한 www 는 많은 사람들이 서로 의사 소통하는 방법론을 바꾸게 되었다. 하지만, 아직까지 www의 비효율성, 즉 효율적으로 정보를 전달하지 못하기 때문에, 시멘틱 웹이 필요하게 된 것이다. 시멘틱 웹은 월드 와이드 웹의 창시자인 팀 버너스리(1980년대 국방부 프로젝트로 www 웹을 만든 창시자이다)가 자서전 형식으로 쓴 "Weaving the web"라는 책에 의해 처음 소개개 되었다. 국내에서는 "월드 와이드 웹 : 당신이 꿈꾸는 인터넷 세상" 라는 번역서로도 출간되기도 하였다. 이 말은 미래의 큰 변화는 또 하나의 가상 공간을 매개로 하여, 현실 세계에 직접적인 영향을 주게 된다는 암시이다.13장에서는 시멘틱 웹에 대한 내용이 소개되기도 한다.

시멘틱웹의 정의

시 멘틱 웹의 정확한 의미는, 기계가 이해할 수 있는(machine understandable) 보다는, 기계처리가 가능한(machine processable)으로 이해하는 것이 더 정확하다. 기계가 정보를 이해한다는 지능적 요소를 의미하는 것이 아니며, 기계가 정보를 처리 하는 수행업무를 맡을 수 있느냐에 대한 여부를 따지게 된다. 결국 기계와 기계/인간과 의사소통하기 위한 웹 환경을 구현하겠다는 것이다. 여기서 말하는 기계는, agent라고 이해하면 될 것 같다. 에이전트가 웹 환경을 통해서 정보를 교환하거나, 더 나아가서는 협상(Negotiation)까지 할 수 있게 된다. 결국 사람을 위해 이러한 업무를 수행하게 된다.

개념화 과정(conceptualization process)

추론 과정(inferring process)


위 의 두 과정을 통해서 정보를 자율적으로 검색하여 제공하는 역할을 한다. 결국 사람이 쉽게 찾을 수 있는 정확하지 않는 데이터를 제공하는 것이 아닌, 정교한 지식(정보)를 제공한다는 것이다. 시멘틱 웹은 온톨로지 공학(Ontology Engineering)과 지식표현(knowlege representation) 등 인공지능 기술을 기반으로 구현된다. 현 단계에서는 두 표준화 그룹, ISO와 W3C에서 시멘틱 웹을 표현하기 위한 언어를 표준화 하고, 언어의 완성도를 높이게 된다. ISO에서는 토픽맵 언어를 발표하였으며, W3C에서는 RDF,RDF(S), OWL을 발표하였다. 이 두 표준화 기구의 관계는 경쟁적이라기 보단, 상호보완적이라고 할 수 있다.



시멘틱 웹의 구성 요소

온톨로지(Ontology) 특정 분야에서 서로 달리 사용하는 정보 간 의미적 상호 운용성을 극대화 하기 위한 용어, 개체, 개념 등의 표준화, 이들 간 의미적 관계, 사용규칙 및 제한점을 정의한 개념의 집합이다.

웹 서비스 웹 서비스는 원격지의 데이터나 서비스들인 컴포넌트를 호출하여 그 결과값을 반환 받게 된다.


시멘틱 웹의 목적성/전망

Semantic Web의 목적은 현 웹 표현방식인 HTML 언어의 한계를 해결하기 위해 고안된 XML 언어 기반의 차세대 웹이다. 시멘틱 웹이 구현하고자 하는 환경은, 인간의 언어 구조가 기계에게도 이해가 될 수 있도록 하는 것이다. 그런 의미에서, 텍스트 프로세싱이 필요하게 된다. 이러한 원천 기술은 다음 두 분야로 부터 도움을 받을 수 있다.

Computational linguistics

Artificial Intelligence



시 멘틱 웹은 현존하는 www을 대체한다는 것이 아니라, 파생되는 개념으로서, 좀 더 체계화 하게 된다는 목적성을 갖게 된다. 미국방부에서 시멘틱웹을 표현하기 위한 언어로 DAML(DARPA Agent Markup Language)까지 개발한 만큼, 경쟁력이 있다는 사실을 입증한다.

왜 시멘틱 웹이 필요한가.

웹 정보가 사람을 위한 것이었다면, 시맨틱 웹 정보는 기계를 위한 정보이므로, 인간을 중심으로 상호작용 하는 기계들의 Main Context, 즉 중요한 상황 정보로 작용한다.

시멘틱 웹의 사업성

정보 연구 기관에 의하면, 2010년의 시맨틱 웹 시장 규모가 400억~600억 달러에 달할 것으로 예측된다.

현재 웹의 문제점

현재 컴퓨터는 특정 수식을 계산하기 보다는, 정보를 가공하는 단말기로 사용되고 있으며, 웹은 컴퓨터들을 매개하고 있다. 현재 웹의 가장 큰 혁신화라고 할 수 있는 것은 키워드 기반 검색어의 웹 엔진을 갖추고 있다는 점이다.

- 낮은 적중율: 키워드로 검색하게 되면, 대부분 사용자가 원하는 정보를 제공하지 못한다.

- 검색어의 제한: 키워드가 길거나, 검색 엔진에서 검색할 수 없는 제한된 정보일 때 발생환다.

- 단어에 의존도가 높다: 검색 엔진은 주로 단어를 중심으로 검색하기 때문에 높은 의존도를

                                  보이기 때문에 문맥상 잘못된 결과를 가져오게 된다.

- 제한된 화면상의 정보: 검색 엔진을 통해 정보를 검색하게 되면, 하이퍼링크를 눌러야지만, 해당 정보를 볼 수 있기 때문에, 사용자가 원하는 정보가 나왔는가에 대해 확인하기 위해서는 그 과정이 매우 귀찮고, 시간이 낭비된다.


결 국 현재의 웹은 "지식검색"이라고 하기 보단, "위치 또는 경로 검색(Location Finder)"라는 표현이 더 정확하다. 유비쿼터스 컴퓨팅의 pervasiveness는 www의 시멘틱웹을 기반으로 보편화 될 것으로 기대된다.



글. 정기욱 [uc 시멘틱 웹 Part 1]

 

이 글은 스프링노트에서 작성되었습니다.