컴퓨터와 정보사회

정보검색

KIKI_BI0 2022. 8. 2. 17:59
SMALL

검색엔진

: 실시간으로 생성되는 수많은 양의 문서들을 자동으로 수집하고 분석한 후 이를 분류하여 상ㅇ자가 원하는 정보를 빠르고 쉽게 검색할 수 있도록 한다.

 

사용자는 사용자 인터페이스를 통하여 원하는 정보를 찾아 달라고 요청한다.

사용자의 요청은 검색 처리기에 의하여 특정 검색모델의 언어로 표현된 검색어로 변환된다.

이때 검색 처리기가 인덱스 저장소로 접근하여 검색어와 연관성이 높은 웹 문서를 빠르게 찾아낸다.

 

수집기는 인터넷상에서 생성되는 수많은 웹 문서들을 자동으로 탐색하여 검색엔진이 보유한 문서 집합을 문서 저장소에 최신 상태로 유지한다.

색인기는 문서 저장소로부터 웹 문서들을 분석하고 색인에 필요한 색인어를 추출한다.

그 다음 이를 쉽고 빠르게 찾을 수 있도록 구조화하여 인덱스를 구축한다.

 

검색모델은 요청된 검색어와 유사한 문서를 찾기 위해서 각 문서와 검색어 사이의 유사성을 판별하기 위한 규칙이다.

검색모델은 문서와 문서 사이의 유사도를 수학적으로 정의하며, 유사도 함수가 유사성을 잘 가려내지 못하면 검색의 품질이 저하될 수 있다.

대표적인 검색모델로는 문서와 검색어를 색인어 집합으로 표현하는 불리언 모델과, 문서와 검색어를 실수 공간상의 벡터로 표현하는 벡터 공간 몯ㄹ이 있다.

 

검색엔진을 평가하기 위해서는 해당 분야의 전문가들이 평가를 목적으로 만든 문서들의 집합인 코퍼스가 사용된다.

이때 주어진 검색어와 관련된 문서를 얼마나 정확히 찾아내는지 알기 위해 정확률과 재현율이란 척도를 사용한다.

또한 검색엔진이 검색과 관련된 일을 처리하는 데에 소요되는 시간관점과 소모되는 자원의 관점으로 효율성을 평가한다.

 

실세계에는 다양한 정보검색 방법이 존재하며 기초적으로 원하는 문서를 찾아주는 검색 사이트가 존재한다.

요즘은 텍스트뿐만 아니라 이미지 검색, 음악 검색 등 멀티미디어 자원으로 검색하는 것도 가능하다.

또한 다양한 기능을 탑재한 스마트 기기로 음성 검색, OR코드 검색, 위치를 기반으로 한 실시간 교통정보 검색이 가능하다. 원하는 키워드로 시간의 흐름에 따른 지역별 관심도를 검색을 통하여 얻어 트렌드를 한눈에 볼 수 있는 트렌드 검색도 존재하며, 수많은 상품 중에 사용자가 원하는 상품을 검색할 수 있도록 상품 검색 사이트도 발전하고 있다. 부가적으로 여행정보 검색을 통하여 숙박업소 예약과 여행 시 계획을 세우는 것도 훨씬 수월해질 수 있다.

 

검색엔진은 사용자 프로파일을 구축하여 개인화된 검색기술, 그리고 지식 간의 유의미한 관계 정보를 처리하여 새로운 지식을 발견할 수 있는 시맨틱 검색기술의 활용으로 점점 발전하고 있다.

 

 

LIST

'컴퓨터와 정보사회' 카테고리의 다른 글

정보 서비스  (0) 2022.08.08
네트워크  (0) 2022.07.29
운영체제  (0) 2022.07.25
컴퓨터의 구조  (0) 2022.07.06
컴퓨터와 프로그램  (0) 2022.06.30