| 비 구조화된 문서는 우리가 흔히 사용하는 문서(HTML, DOC, PDF, XLS, PPT)를 말한다. 비 구조화된 문서는 데이터와 양식을 분리하지 않고 구조화되지 않은 문서이다. 비 구조화된 문서로 정보를 저장해서 가지고 있으면 다음과 같은 약점이 있다. ① 한 문서에 데이터와 양식을 같이 가지고 있기 때문에 저장부분에 중복된 양식을 매 문서마다 가지고 있다. ② 문서내용 검색 시 처음부터 끝까지 모두 검색해야 한다. 일명 풀 텍스트(Full Text) 검색이라고 하는데, 비 구조화된 문서에서의 검색은 검색시간이 오래 걸린다는 것이다. ③ 인터넷으로 문서를 주고 받을 경우에 여러 가지 약점들이 나타난다. 비 구조화된 문서는 전송속도가 느리다. 데이터와 양식 부분을 함께 전송해야 하기 때문에 용량이 XML문서보다 매우 크기 때문이다. ④ 문서를 받아 쓰려면 그것을 사용할 전용 프로그램이 따로 필요하다. MS Office, 한글 HWP, Adobe PDF 기타 등등...... 무료로 전용 뷰어를 설치하면 되지만 문서를 작성하려면 프로그램을 구입해야 한다. ⑤ 비 구조화된 문서는 데이터와 양식이 한 문서에 있기에 기계가 이해하지 못하고 사람이 해독해야만 그 내용을 판독할 수 있다. 예를 들어, 워드나 PPT문서로 된 주문서를 하루에 100건씩 한 달에 3,000건을 처리한다면 사람이 일일이 내용을 확인하고 처리해야 하기 때문에 시간과 비용, 공수가 많이 든다. ⑥ 양식부분의 내용이 바뀔 경우 대책이 없다. 회사로고나 보험 규정, 약관 등이 바뀔 경우 문서마다 가지고 있는 양식부분의 내용을 일반문서에서는 바꿀 수 없다. 이 부분은 통합 시스템 구현 시 더 커다란 문제로 나타난다. 원본 데이터와 보낸 데이터의 값이 틀리는 경우가 발생한다는 것이다. | |
| |
| 이런 비 구조화된 정보 문서의 약점 중에 가장 커다란 약점은 인터넷으로 문서를 교환할 경우 사람이 해독해야만 하고 이 문서의 정보를 DB에 넣으려면 사람이 수동으로 처리해야 한다는 것이다. 비 구조화된 문서들을 가지고 인터넷 상에서 나타나는 문제점들은 어떤 것들이 있을까? 해결해야 할 과제들은 다음과 같다. |
TAG automation,
HTML,
RTE,
Semantic Web,
SOA,
structured,
UCC,
Web 2.0,
XML,
XSL,
XSLT,
구조화,
비구조화,
시맨틱웹,
웹,
웹 2.0,
인터넷,
자동화,
전송,
컨텐츠,
표준화



jason.kim01@gmail.com
댓글을 달아 주세요
좋은 영역! 걸출한 영역!
일! 우수한 감사!
일! 우수한 감사!
저에서 유사한 역사는 이었다.
우수한 위치! 많은 감사.
그런 위치를 경이롭 위해 많게의 감사!
너의 방문한 위치를 즐기는!
일! 우수한 감사!
일! 우수한 감사!