2019년 1월 24일
LOD (Linked Open Data)
I. 개방형 URI기반 데이터, LOD
가. LOD (Linked Open Data)의 개념
- 자유롭게 사용이 가능하며, 저작권 표시 및 변경 허락 조건하에 재배포 가능한 링크 기반 개방형 데이터
나. LOD의 특징
특징 | 설명 |
---|---|
사용성 및 접근 | – 언제든지 전체 데이터 이용/다운로드 가능 – 편리하고 수정 가능한 형태로 제공 |
재사용 재배포 | – 사용 및 재사용, 저작권 표시와 변경 허락 조건하에 변경 후 재배포 가능 |
보편적 참여 | – 누구나 데이터를 이용 / 재배포 가능 – 활동분야, 특정 사람/그룹 비차별 |
상호 운용성 | – 서로 다른 데이터셋 사이 혼합/참조 – 데이터 간 연결이 가능한 구조 |
- Open의 의미는 저작권 보호와 상호운용성을 의미
II. 오픈데이터 개방도 등급 5단계
가. 팀 버너스리의 오픈데이터 개발 5단계
- 웹과 링크드 데이터를 만든 팀버너스리의 별점 이용 데이터 개방 단계 제안
나. 오픈데이터 5단계 상세 내용
단계 | 유형 | 설명 |
---|---|---|
★ | – OL(On-Line) – 이미지, PDF | – 웹 상 개방형 라이선스 – 포맷 무관 공개 상태 |
★★ | – OL + RE(REadable) – Excel 파일 등 | – 기계 가독성, 구조화 – 특정 소프트웨어 종속 |
★★★ | – OL + RE + OF(Open Format) – CSV 파일 등 | – 소프트웨어 독립적 – 웹 자체 포함 형태 아님 |
★★★★ | – OL + RE + OF + URI – RDF 등 | – URI로 개체 식별 – 데이터 개방 형태 |
★★★★★ | – OL + RE + OF + URI + LD(Linked Data) | – 연결 데이터 원칙 준수 – 타 데이터 상호운용 가능 |
III. 주요 오픈데이터 플랫폼
구분 | 플랫폼 | 특징 |
---|---|---|
오픈 소스 | CKAN | – OKF 개발, 다양한 국가에서 활용 – 콘텐츠 관리, 시각화, API 추출 가능 |
OGPL | – OGP는 미국, 인도 공동 개발 플랫폼 – 플랫폼을 오픈소스로 공개 | |
상용 서비스 | Socrata | – 클라우드 기반 오픈데이터 플랫폼 – 오픈소스에 비해 시각화 및 분석 장점 |
Junar | – 클라우드 기반 오픈데이터 플랫폼 – Socrata 대비 기본 서비스 비용 저렴 |
IV. 웹 문서와 LOD 차이점
가. 웹 문서와 LOD 개념 차이
웹 문서 | LOD |
---|---|
– HTML + 링크 – 문서의 소재를 URI로 표현 – 문서를 키워드로 검색 | – 데이터(RDF) + 링크 – 문서의 소재를 URI로 표현 – 데이터 연결/활용 용이 |
나. 웹 문서와 LOD 비교
항목 | 웹문서 | LOD |
---|---|---|
디자인 | 인간 소비 지향 | 기계화 우선 |
주요객체 | 문서 | 사물, 사물 묘사 |
연결 | 문서 간 연결 | 사물 간 연결 |
구조화 | 매우 낮음 | 높음 |
연결 의미 | 암묵적 | 명시적 |
- 웹 문서와 LOD는 위 차이점 외 글로벌 데이터 시스템을 공통점으로 사용
V. LOD 기술 요소
가. RDF (Resource Description Framework)
- Resource(URI를 부여할 수 있는 모든 개체), Description (Resource를 상세 설명), Framework(표현 방식)
- 웹 상에서 특정 정보자원을 상세히 표현하는 틀, 표현 방식
- 정보자원을 주어, 술어, 목적어로 표현하는 트리플이 기본
항목 | 설명 | 사례 |
---|---|---|
주어 | 설명하고자 하는 무엇 | “1박2일” |
술어 | 주어를 설명하는 요소 | 제작자, 출연진, 시간 |
목적어 | 술어에 대한 정보 객체 | 제작자=나영석 |
나. URI (Universal-Uniform Resource Identifier)
- 웹상의 정보, 데이터의 장소(위치) 표시하는 기술 방식
- 정보, 데이터를 URI로 표시하여 외부 데이터와 연계 가능
- 예) 기술 서적의 URI: mysite.com/tech/book
다. RDF 표현 방식
- RDF 형식을 토대로 트리플(주술목) 특정 문법에 따라 시리얼화
- 대표적 시리얼화: RDF/XML, RDFa, Turtle, N-Triples, RDF/JSON 등
라. 기타 LOD 기술
기술 요소 | 설명 |
---|---|
RDF 스토어 | – RDF 축적하는 데이터베이스 |
SPARQL | – RDF 검색 질의 언어 |
SPARQL 엔드포인트 | – RDF 스토어의 입출력 인터페이스 |
OWL(Web Ontology Language) | – RDF 메타데이터 이용 어휘 정의 – 데이터 교환 위한 기술 언어 |
[참고]
- 한국정보화진흥원, “알기 쉬운 Linked Open Data”, 2015. 4
2 Comments
도리님, ol 은 online 인 것 같아요. 열공! 빡공!
말씀하신 내용 참고하여 NIA 자료 확인 후 본문에 업데이트하였습니다. 잘못된 부분 지적 감사합니다.^^