주요용어

Ontology

T.Gruber 온톨로지란 공유된 개념화(shared conceptualization)에 대한 정형화되고 명시적인 명세(formal and explicit specification)

  • 도메인 내에서 공유되는 데이터들의 개념화한 형식적이고 명세화한 규정
  • 특정분야에서 사용되는 표준 어휘들의 모음
  • 특정 분야에 대한 개념을 명확히 정의하고, 개념간의 상하구조와 기타 다른 관계 및 제약이 표현되어 있는 데이터베이스
  • 시맨틱웹의 가장 핵심적인 개념으로서, 이를 표현하기 위하여 RDF, RDFS, OWL,TopicMaps 등의 언어가 있음

RDF

  • RDF(Resource Description Framework)는 자원(Resources)을 속성(property)과 속성값(property value)으로 표현하는 모델
  • 'rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>'에서 정의
  • RDF는 주어(subject), 술어(predicate), 목적어(object) 형태의 Triple로 구성됨

RDFS

  • RDFS(RDF Schema)는 RDF를 ‘Schema Vocabulary’로 확장한 것
  • 클래스와 속성을 정의
  • 연관된 자원의 그룹과 자원 사이의 관계를 묘사하기 위한 방법을 제공
  • 주요 Vocabulary : Class, subClassOf, range, domain…
  • 'rdfs:<http://www.w3.org/2000/01/rdf-schema#>'에서 정의

OWL

  • OWL (Web Ontology Language)은 RDF, RDFS에 형식적인 의미를 가진 Vocabulary를 추가하여 XML, RDF, RDFS에서 지원하는 것보다 웹 컨텐츠의 기계적 해석을 더 용이하게 한 것
  • Class와 property의 상속적 계층구조의 개념과 그 개념들 사이의 관계가 보다 명료하게 정의
  • 관계들 간의 계층구조, 관계 인스턴스 내에서의 논리적 제약조건 등을 포함
  • 주요 Vocabulary : Class, DatatypeProperty, ObjectProperty, inverseOf, sameAs ...
  • 'owl:<http://www.w3.org/2002/07/owl#>'에서 정의

Class

  • 동일한 속성을 지니고 있어 하나로 묶을 수 있는 Individual 집합

Instance

  • Class에 속한 개별적인 객체

Data Property

  • Data Property(Datatype Property)는 데이터 속성으로서, Class가 취해야 하는 데이터의 형식과 값을 정의

Object Property

  • Object Property는 관계에 대한 속성으로서, Class 요소간의 관계를 정의

URI

  • URI(Uniform Resource Identifier)는 웹상의 다양한 자원을 식별할 수 있는 표준 식별체계
  • 데이터에 대한 정보를 기계가 처리하기 위해서는 데이터를 분명하게 구별할 수 있어야 하는데, 이 구별을 위하여 각 자원을 URI로 생성하여 사용함
  • URI는 자원의 Identity를 유일하게 지칭할 수 있는 식별자로서, 네임스페이스(Namespace), 접두어(Prefix), 식별자(identifier)로 구성
  • 예) (I10.0.양성 고혈압) http://data.mohw.kr/resource/Disease/I100

Linked Data

  • Linked Data는 URI를 통해 웹 데이터를 공개, 연결, 공유하는 방법
  • 모든 데이터를 리소스 단위로 제작하여 가공되지 않은 raw data를 이용자에게 공개, 사용자가 개별 요구에 맞게 데이터를 이용할 수 있도록 함
  • URI기반의 HTTP 역참조(dereference)를 통해 외부의 Linked Data에 접근 가능
  • RDF를 통해 기계가독형으로 보유 정보를 웹으로 발행하며, 내외부의 정보를 질의하기 위한 질의 언어로서 SPARQL을 이용

SPARQL

  • SPARQL(Simple Protocol and RDF Query Language)은 온톨로지 질의(Query) 언어
  • SPARQL은 크게 PREFIX, {SELECT, ASK, DESCRIBE, CONSTRUCT}, WHERE로 구성
  • PREFIX는 일반 데이터베이스에서 데이터베이스 선택과 비슷한 의미로써 사용할 데이터 셋을 지정할 때 사용
  • Linked Data는 SPARQL을 Query 할 수 있는 SPARQL EndPoint를 구축하여 사용자로 하여금 직접 Query를 작성하여 데이터를 활용할 수 있도록 함