2017년 5월 29일 월요일

정보검색 웹과 웹 문서의 특성, 크롤러 (Crawler)에 대하여

정보검색 웹과 웹 문서의 특성, 크롤러 (Crawler)에 대하여
[정보검색] 웹과 웹 문서의 특성, 크롤러 (Crawler)에 대하여.hwp


목차

1. 서론

2. 본론
2.1 웹 탐색 개요 - 웹과 웹 문서의 특성
2.2 탐색엔진의 구조 - 크롤러

3. 결론

4. 소감

5. 참고문헌


본문
1. 서론

현대에 이르러 정보를 검색함에 있어 가장 많이 이용하는 것이 인터넷이고 인터넷에서 우리가 읽고 사용하는 문서의 형태가 바로 웹 문서이다. 우리가 평소 쉽게 검색하고 이용하고 있지만 웹과 웹문서의 특성, 이것들을 이용하기 위한 탐색엔진의 구조와 같은 것들은 이해하지 못하고 있다. 이번 과제를 통해 그 동안 우리가 별다른 스트레스 없이 손쉽게 웹과 웹문서를 탐색할 수 있었던 이유와 그 과정, 탐색엔진의 구조 등을 이해 할 수 있을 것이다.

2. 본론

2.1 웹 탐색 개요 - 웹과 웹문서 특성

웹 : 인터넷이라는 시스템을 통해 서로서로 거미줄처럼 연결된 하이퍼텍스트 문헌 시스템으로 웹 서버와 웹 브라우저(클라이언트)로 구성되어 있다. 웹 서버와 웹 브라우저는 html이라는 마크업 언어와 URL로 서로 의사소통을 이룬다. html은 http의 마크업언어로 웹 문서를 만들기 위하여 사용하는 기본적인 프로그래밍 언어의 한 종류이다. 하이퍼텍스트를 작성하기 위해 개발되었다. URL이란 Uniform Resource Locator의 약자로서 웹 문서의 각종 서비스를 제공하는 서버들에 있는 파일의 위치를 표시하는 표준을 말한다.
웹 브라우저는 특정 URL을 지정하는 http질의를 웹 서버로 보낸다. 그 후 질의된 URL 서버는 html 파일을 브라우저에게 보내게 된다. html 파일은 하이퍼링크와 내용들을 담고 있으므로 이용자는 클라이언트를 이용해 웹 문서 사이를 이동하며 웹 페이지를 살펴볼 수 있게 되는 것이다.


참고문헌
노정순. 2011. 『정보검색 이론과 실제』. 대전: 한남대학교출판부.

김동조. 2008. 『웹 크롤러를 이용한 주제정보서비스』. 인하대학교, 석사학위 논문.

김광영, 이원구, 윤화묵, 신성호, 이민호. 2011. 『웹 자원 아카이빙을 위한 웹 크롤러 연구 개발』. 한국콘텐츠학회논문지.

구글. http://www.google.co.kr/.

네이버. http://www.naver.com/.

다음. http://www.daum.net/.

야후. http://kr.yahoo.com/.

네이트. http://www.nate.com/.






키워드
정보검색, 크롤러, Crawler, 정보, 문서

댓글 없음:

댓글 쓰기