당신이 알고 있는 검색 엔진을 나열하십시오. 인터넷 검색 엔진이 작동하는 방식. 실제로 나열한 기계의 등급은 무엇이며, 어떤 기계가 더 많이 사용되고, 어떤 기계가 덜 사용됩니까?

검색 엔진(검색 엔진)

검색 엔진을 사용하면 특정 주제와 관련되거나 키워드 또는 키워드 조합이 포함된 WWW 문서를 찾을 수 있습니다. 검색 서버에는 두 가지 검색 방법이 사용됩니다.

· 개념의 계층 구조에 따라;

· 키워드별.

검색 서버는 자동 또는 수동으로 채워집니다. 검색 서버에는 일반적으로 나머지 서버에 대한 링크가 있습니다. 검색 서버, 사용자의 요청에 따라 검색 요청을 보냅니다.

검색 엔진에는 두 가지 유형이 있습니다.

1. 중지 단어를 제외하고 웹 페이지의 모든 단어를 색인화하는 "전체 텍스트" 검색 엔진.

2. 각 페이지의 초록을 생성하는 "초록" 검색 엔진.

웹마스터의 경우 웹페이지에 있는 모든 단어를 분석하여 사용자 쿼리와의 관련성을 판단하므로 전체 텍스트 엔진이 더 유용합니다. 그러나 추상 엔진은 전체 텍스트 엔진보다 페이지를 더 잘 색인화할 수 있습니다. 이는 동일한 단어의 사용 빈도 등 정보를 추출하는 알고리즘에 따라 달라집니다.

검색엔진의 주요 특징.

1. 검색 엔진의 크기는 색인된 페이지 수에 따라 결정됩니다. 그러나 언제든지 사용자 요청에 따라 제공되는 링크의 연령이 다를 수 있습니다. 이런 일이 발생하는 이유:

· 일부 검색 엔진은 사용자 요청에 따라 페이지를 즉시 색인화한 다음 아직 색인화되지 않은 페이지를 계속해서 색인화합니다.

· 다른 사람들은 종종 가장 많은 색인을 생성합니다 인기 페이지네트워크.

2.인덱싱 날짜. 일부 검색 엔진은 문서가 색인화된 날짜를 표시합니다. 이는 사용자가 문서가 온라인에 나타난 시기를 결정하는 데 도움이 됩니다.

3. 색인 깊이는 지정된 페이지 이후에 검색 엔진이 색인을 생성할 페이지 수를 보여줍니다. 대부분의 컴퓨터에는 인덱싱 깊이에 대한 제한이 없습니다. 일부 페이지의 색인이 생성되지 않는 이유:

· 아니다 올바른 사용프레임 구조.

· 중복 없는 사이트맵 사용 일반 링크

4.프레임 작업. 만약에 검색 로봇프레임 구조 작업 방법을 모르면 인덱싱 중에 프레임이 있는 많은 구조가 누락됩니다.

5. 링크 빈도. 주요 검색 엔진은 문서가 링크되는 빈도에 따라 문서의 인기를 결정할 수 있습니다. 일부 기계는 이러한 데이터를 기반으로 문서를 색인화할 가치가 있는지 여부를 "결론"합니다.

6.서버 업데이트 빈도. 서버가 자주 업데이트되면 검색 엔진은 해당 서버를 더 자주 다시 색인화합니다.

7. 인덱싱 제어. 검색 엔진을 제어하는 ​​데 사용할 수 있는 도구를 보여줍니다.

8.리디렉션. 일부 사이트는 방문자를 한 서버에서 다른 서버로 리디렉션하며, 이 옵션은 이것이 발견된 문서와 어떻게 관련되는지 보여줍니다.

9. 단어를 중지하십시오. 일부 검색 엔진은 색인에 특정 단어를 포함하지 않거나 사용자 쿼리에 해당 단어를 포함하지 않을 수 있습니다. 이러한 단어는 일반적으로 전치사 또는 자주 사용되는 단어로 간주됩니다.

10.스팸 벌금. 스팸 차단 기능.

11.오래된 데이터를 삭제합니다. 서버를 닫거나 다른 주소로 이동할 때 웹마스터의 조치를 결정하는 매개변수입니다.

검색 엔진의 예.

1. 알타비스타. 이 시스템은 1995년 12월에 문을 열었습니다. DEC가 소유합니다. 1996년부터 그는 Yahoo와 협력해 왔습니다. 알타비스타는 최선의 선택맞춤 검색을 위해 . 그러나 카테고리별로 결과를 정렬하면이는 완료되지 않았으며 제공된 정보를 수동으로 검토해야 합니다. AltaVista는 활성 사이트 목록, 뉴스 또는 기타 콘텐츠 검색 기능을 검색하는 수단을 제공하지 않습니다.

2.흥미로운 검색. 1995년 말에 출시되었습니다. 1996년 9월 - WebCrawler에 인수되었습니다. 이 유닛은 강력한 검색 모피를 가지고 있습니다.낮음, 자동 개별 설정 가능성제공된 정보와 수집된 자격자격을 갖춘 직원이 여러 노드에 대해 설명합니다.일으키다 다른 검색노드와 다른점은뉴스 서비스를 검색하고 리뷰를 게시할 수 있습니다.웹페이지. 검색 엔진은 도구를 사용합니다표준 키워드 검색 및 휴리스틱콘텐츠 검색 방법. 이 조합 덕분에관련 페이지를 찾을 수 있습니다편물, 사용자가 지정한 키가 포함되어 있지 않은 경우단어 익사이트의 단점 다소 혼란스러운 인터페이스입니다.

3.핫봇. 1996년 5월 출시. Wired 소유. Berkeley Inktomi 검색 엔진 기술을 기반으로 합니다. HotBot은 색인이 생성된 문서를 포함하는 데이터베이스입니다. 전문, 웹에서 가장 포괄적인 검색 엔진 중 하나입니다. 부울 검색 기능과 특정 영역이나 웹 사이트로 검색을 제한하는 기능은 사용자가 원하는 것을 찾는 데 도움이 됩니다. 필요한 정보, 불필요한 것을 제거합니다. HotBot은 선택할 수 있는 기회를 제공합니다 필수 매개변수드롭다운 목록에서 검색하세요.

4.정보 탐색. 1995년 이전에 출시되었으며 쉽게 접근할 수 있습니다. 현재 약 5천만 개의 URL이 포함되어 있습니다. Infoseek은 잘 디자인된 인터페이스와 뛰어난 기능을 갖추고 있습니다. 검색 도구. 쿼리에 대한 대부분의 응답에는 "관련 주제" 링크가 수반되며, 각 응답 뒤에는 "유사한 페이지" 링크가 따라옵니다. 전체 텍스트로 색인된 페이지의 검색 엔진 데이터베이스입니다. 답변은 두 가지 지표, 즉 페이지에 있는 단어나 문구의 출현 빈도에 따라 정렬됩니다. tsakh 및 페이지의 단어 또는 구문 위치.검색할 수 있는 수백 개의 하위 범주가 포함된 12개 범주로 구분된 웹 디렉토리가 있습니다. 각 카탈로그 페이지에는 재목록이 포함되어 있습니다. 추천 노드.

5. 라이코스. 1994년 5월부터 운영. 널리 알려져 사용되고 있습니다. 여기에는 수많은 URL이 포함된 디렉토리가 포함되어 있습니다. 그리고 기술이 담긴 포인트 검색 엔진 통계 분석전체 텍스트 인덱싱과 반대되는 페이지 콘텐츠입니다. Lycos에는 뉴스, 사이트 리뷰, 인기 사이트 링크, 도시 지도, 주소, 이미지를 찾는 도구가 포함되어 있습니다. 표현과 사운드, 비디오 클립.라이코스 상관관계 정도에 따라 답변을 정렬합니다.여러 기준(예: 숫자)을 기반으로 요청을 충족합니다.문서 초록에서 lu 검색어를 찾았습니다.멘션, 사이의 간격말을 하다 특정 문구문서, 위치문서의 용어.

6. 웹크롤러. 1994년 4월 20일 워싱턴 대학의 프로젝트로 개관했습니다. 웹크롤러 기회를 제공합니다쿼리를 지정하는 구문뿐만 아니라 큰 선택 간단한 인터페이스를 사용한 노드 주석.


각 응답에 따라 WebCrawler는 요청이 일치했는지 여부를 대략적으로 평가한 작은 아이콘을 표시합니다. Comee는 또한 각 답변에 대한 간략한 요약, 전체 URL, 정확한 일치 점수가 포함된 페이지를 표시하고 다음을 사용합니다. 샘플 쿼리에서 이 답변을 키워드로 사용하세요.쿼리 구성을 위한 그래픽 인터페이스웹 크롤러가 없습니다. N 허용되지 않습니다보편적인 상징의 사용도 불가능하다키워드에 가중치를 부여합니다.검색 필드를 제한할 수 있는 방법이 없습니다.특정 지역.

7. 야후. 야후의 가장 오래된 디렉토리는 1994년 초에 출시되었습니다. 널리 알려지고 자주 사용되며 가장 존경받는 제품입니다. 1996년 3월, Yahooligans 어린이용 카탈로그가 출시되었습니다. Yahoo 지역 및 상위 디렉토리가 나타납니다. Yahoo는 사용자 구독을 기반으로 합니다. 분류 시스템 덕분에 웹 검색의 출발점이 될 수 있습니다. 사용자가 찾을 것입니다정보가 잘 정리된 사이트. 웹 콘텐츠는 14가지 일반 범주로 분류되며 다음 목록에 나와 있습니다. 홈페이지야후!. 사용자 요청의 세부 사항에 따라 이러한 범주를 사용하여 하위 범주 및 노드 목록에 대해 알아보거나 검색할 수 있습니다. 특정 단어및 데이터베이스 전체의 용어. 사용자는 Yahoo!의 섹션이나 하위 섹션 내에서 검색을 제한할 수도 있습니다. 노드의 분류는 사람이 수행한다는 사실로 인해컴퓨터가 아닌 경우 일반적으로 링크 품질이 매우 높습니다. 그러나 실패할 경우 검색을 세분화하는 것은 어려운 작업입니다. 야후에 가입하세요 ! 검색 엔진 포함 AltaVista에서 Yahoo! 그것은 자동으로 발생합니다 검색 엔진을 사용하여 반복알타비스타 . 결과는 다음으로 전송됩니다.야후!. 야후! 주소를 찾기 위해 Usenet 및 Fourl 1에 검색어를 보내는 기능을 제공합니다. 이메일.

러시아어로 검색 엔진말하다:

1. Rambler는 러시아어 검색 엔진입니다. 홈에 나열된 섹션 램블러 페이지, 러시아어 웹 리소스에서 다룹니다. 정보 분류기가 있습니다. 편리한 기회작업은 각 노드에 대해 가장 많이 방문한 노드 목록을 제공하는 것입니다. 제안된 주제.

2. 공항 검색. 아포트 선도적인 인증 검색 엔진 중 하나로 선정마이크로소프트 지역 검색 엔진처럼러시아어 버전용 시스템마이크로소프트 인터넷 익스플로러. Aport의 장점 중 하나는 영어-러시아어 및 러시아어-영어 번역입니다. 온라인 모드쿼리 및 결과 검색을 통해 러시아 인터넷 리소스에서 검색할 수 있습니다. , 러시아어를 몰라도. 게다가정보를 검색할 수 있어요 문장에도 표현을 사용합니다.주요 속성 중에는 검색 엔진가져올 수 있나요?다음을 나눕니다.

쿼리 및 검색 결과를 러시아어에서 영어로 번역중국어와 그 반대;

자동 확인 철자 오류요구;

발견된 사이트에 대한 검색 결과의 정보 표시

어떤 문법 형태로든 검색할 수 있는 능력


전문가를 위한 고급 쿼리 언어 현금 사용자.

기타 검색 속성은 다음과 같습니다.5대 핵심을 잡고 코드 페이지(다른 운영시스템) 러시아어의 경우 검색 기술을 사용하여아무런 제한이 없습니다 URL 문서 및 날짜, 검색 구현제목, 댓글, 서명으로사진 등에 검색 매개변수 저장 및 정의이전 사용자 요청 수, 병합 다른 서버에 있는 문서의 사본.

3. 목록. 루 ( http://www.list.ru) 구현 과정에서 이 서버에는 많은영어 시스템의 공통점야후!. ~에 홈페이지서버에는 가장 인기 있는 검색 카테고리에 대한 링크가 포함되어 있습니다.


카탈로그의 주요 카테고리에 대한 링크 목록이 중앙 부분을 차지합니다. 카탈로그 검색은 쿼리 결과로 개별 사이트와 카테고리를 모두 찾을 수 있는 방식으로 구현됩니다. 검색에 성공하면 URL, 제목, 설명, 키워드. 허용되는 사용 Yandex 쿼리 언어. 와 함께링크 "구조카탈로그'는 별도의 창에서 전체 kata 카테고리를 엽니다.통나무. 루브리케이터에서 선택한 하위 카테고리로 이동하는 기능이 구현되었습니다. 좀 더 세부적인 주제별 구분현재 섹션은 링크 목록으로 표시됩니다.카탈로그는 이렇게 구성되어 있습니다 이에 포함된 모든 사이트는 낮은 수준구조투어도 섹션별로 제공됩니다.표시된 리소스 목록은 알파벳순으로 정렬되지만 다음 기준으로 정렬하도록 선택할 수도 있습니다.메뉴 추가, 전환별,별 카탈로그에 추가하는 순서에 따라카탈로그 방문자 사이에서 인기가 높습니다.

4. 얀덱스. 소프트웨어 제품 Yandex 시리즈는 러시아어의 형태를 고려하여 전체 텍스트 색인화 및 텍스트 데이터 검색을 위한 도구 세트를 나타냅니다. Yandex에는 형태학적 분석 및 합성, 인덱싱 및 검색을 위한 모듈은 물론 문서 분석기, 마크업 언어, 형식 변환기 및 스파이더와 같은 보조 모듈 세트가 포함되어 있습니다.

기본 사전을 기반으로 한 형태소 분석 및 합성 알고리즘은 단어를 정규화할 수 있습니다. 즉, 초기 형태를 찾을 수 있으며 기본 사전에 포함되지 않은 단어에 대한 가설도 구축할 수 있습니다. 체계 전체 텍스트 인덱싱압축된 색인을 생성하고 다음을 기반으로 빠르게 검색할 수 있습니다. 논리 연산자.

Yandex는 로컬 및 내부에서 텍스트 작업을 수행하도록 설계되었습니다. 글로벌 네트워크, 다른 시스템에 모듈로 연결할 수도 있습니다.

물론, 인기 있는 검색 엔진 목록은 여기서 끝나지 않습니다. 그 수는 수백 개에 이릅니다. 그러나 나는 이것이 영어 사이트에서 작업하기에 충분할 것이라고 확신합니다.

위에 제시된 거의 모든 검색 엔진은 키릴 문자로 작동할 수 있습니다. 하지만 러시아어로 정보를 검색하려면 여전히 국내 검색 엔진을 추천합니다.

다른 러시아어 검색 엔진도 있지만 이것들이 가장 인기가 있으며, 특히 처음 두 엔진이 가장 인기가 있습니다.

쌀. 4.1. 구글 검색 엔진

인터넷에서 흑인 PR에 대응하는 책에서 작가 쿠진 알렉산더 블라디미로비치

"전투" 인터넷 자원을 홍보하고 콘텐츠로 채우기 위한 도구인 검색 엔진 및 디렉토리 이 섹션은 "인터넷 인텔리전스: 행동 지침"이라는 책의 일부 자료를 사용하여 작성되었습니다.

책 블로그에서. 생성 및 홍보 작가 Yushchuk 예브게니 블라디미로비치

블로그를 홍보하고 콘텐츠로 채우는 도구인 검색 엔진 및 디렉토리 블로그 콘텐츠 자동화에 대해 이야기하겠습니다. 흥미로운 내용, 즉, 다른 블로거보다 더 빠르게 블로그 자료를 찾는 방법은 대부분의 독자가 할 수 없을 것입니다.

인터넷 인텔리전스 [행동 지침] 책에서 작가 Yushchuk 예브게니 레오니도비치

검색 엔진에서 회사 이름과 관련된 쿼리 컴파일

자신의 손으로 컴퓨터 조립하기 책에서 작가 Vatamanyuk 알렉산더 이바노비치

5.2. 인기 있는 운영 체제 많은 운영 체제가 있으며 각 운영 체제마다 인기도가 다릅니다. 일부 시스템은 네트워킹에 더 적합하고 다른 시스템은 네트워킹에 더 적합합니다. 배터리 수명, 성능 저하 없이 모든 것을 결합할 수 있고

Win2K FAQ(v. 6.0) 책에서 발췌 저자 샤시코프 알렉세이

(6.10) 혼합 네트워크, 넷웨어 및 NT, 클라이언트 W2kPro 및 W98이 있습니다. W98을 사용하는 컴퓨터는 W2k를 사용하는 컴퓨터에 로그인할 수 없습니다. 이 문제를 해결하려면 프로토콜을 사용하여 바인딩해야 합니다. IPX/SPX는 Novell 클라이언트에만, TCP/IP는 Novell 클라이언트에만 바인딩해야 합니다. 마이크로소프트 클라이언트. 속성에서 할 수 있습니다 네트워크 연결메뉴

책 초록, 교과 과정, 컴퓨터 졸업장에서 작가

검색 엔진 좀 더 구체적이고 구체적인 자료를 선택해야 하는 경우 특별한 정보, 검색 엔진을 사용하는 것이 좋습니다. 검색 엔진은 인터넷 검색을 위한 일련의 특수 프로그램입니다. 그들은 본질적인 단점이 없습니다.

책 인터넷에서. 새로운 기회. 트릭과 효과 작가 Balovsyak Nadezhda Vasilievna

검색 엔진의 작동 방식 및 쿼리를 올바르게 구성하는 방법 최신 검색 엔진은 인터넷에서 정보를 검색하도록 설계된 일련의 특수 프로그램입니다. 작동 원리는 다음과 같습니다.

책 인터넷에서 100%. 자세한 튜토리얼: 초보자부터 전문가까지 작가 글래드키 알렉세이 아나톨리에비치

인기 있는 온라인 영화관 인기 있는 무료 온라인 영화관 중 하나는 http://vsekino.tv에 있습니다(그림 7.5). 쌀.

인터넷 책에서 - 쉽고 간단합니다! 작가 알렉산드로프 에고르

인기 있는 카탈로그 가장 인기 있고 전체 카탈로그세계에서 의심할 여지없이 영어 Yahoo! (http://dir.yahoo.com) (그림 4.4). 쌀. 4.4. 가장 인기 있는 카탈로그 Yahoo! 링크 디렉토리는 종종 검색 엔진과 결합된다는 점에 유의해야 합니다.

모두를 위한 Yandex 책에서 저자 Abramzon M. G.

1.11.3. 인기글 목록 업데이트 인기 게시물하루에 한 번 발생합니다. 이러한 레코드가 수십 개 선택되지만 가장 인기 있는 레코드 중 일부만 제출됩니다. 제목 페이지검색 섹션. 나머지는 총 기록 링크에서 볼 수 있습니다.

책에서 인터넷에서 파일을 찾고 다운로드하는 방법 저자 라이트먼 M.A.

1.11.6. 인기 카테고리 이전에 블로거 순위, 서비스, 가장 인기 있는 게시물에 대해 이야기했다면 이제 카테고리에 대해 이야기하겠습니다. 메시지의 카테고리는 작성자에 의해 결정됩니다. 어떻게, 왜, 왜 - 주제, 패션, 기분에 따라 다릅니다. 하지만

Windows 7의 첫 번째 단계 책에서 발췌. 초보자 가이드 작가 콜리스니첸코 데니스 N.

1.11.7. 인기 뉴스 Yandex 서비스의 뉴스 등급은 다른 지표 중에서 별도의 블록으로 강조 표시됩니다. 소식. 블로그에서 가장 많이 거론되는 뉴스들입니다. 인기 뉴스 목록은 5~10분마다 업데이트됩니다. 의 링크를 따라가시면

책에서 노트북을 만나다 저자 주코프 이반

인기 있는 트래커 전 세계에는 사용할 수 있는 서비스를 제공하는 토렌트 트래커가 많이 있습니다. 다음은 가장 인기 있는 추적기입니다.? http://lostfilm.tv는 TV 시리즈 전문 추적기입니다. 일반적으로 릴리스에는 전문적인 더빙 및 품질이 있습니다.

IT 보안이라는 책에서: 기업을 위험에 빠뜨릴 가치가 있습니까? 린다 맥카시

10.2.1. 인터넷 검색 엔진에는 다음이 포함됩니다. 엄청난 양정보. 결국 인터넷에서는 누구나 웹사이트를 만들 수 있으므로 새로운 사이트의 수가 매일 증가하고 있습니다. 검색 엔진은 인터넷을 검색하는 데 사용됩니다. 검색 엔진은 특별합니다.

작가의 책에서

인기 있는 인터넷 애플리케이션 ICQ(ICQ) ICQ는 중앙 집중식 인스턴트 메시징 서비스입니다. 서비스 사용자(즉, 귀하)는 클라이언트 프로그램(소위 "메신저")을 사용하여 작업합니다. 메시지는 즉시 전송됩니다. 당신은 또한 수

작가의 책에서

인기 있는 우편 목록 Bugtraq 메일링 목록 이 목록에서는 다음 내용을 설명합니다. 취약점 UNIX, 사용 방법 및 종료 방법. 그 목적은 시스템을 해킹하는 방법을 가르치는 것이 아니라 취약점을 발견하는 방법, 이에 대한 정보를 공유하는 방법, 시스템을 해킹하는 방법을 가르치는 것입니다.

실험실 작업 번호 10.

정보 검색 인터넷 네트워크

작업의 목표

주요 인터넷 검색 엔진에 대해 알아보세요. 검색 엔진에서 일하는 기술을 습득하세요. 작업의 세부 사항을 고려하여 최적의 검색 엔진을 선택하는 방법을 알아보세요.

장치 및 재료

실행을 위해 실험실 작업필요한 개인용 컴퓨터, 통제하에 운영 운영 체제 WINDOWS 제품군. 설치해야 함 인터넷 프로그램탐침.

최신 검색 엔진

인터넷은 거대한 정보 저장소입니다. 가치 있는 페이지와 그다지 가치 없는 페이지는 순서 없이 존재하며 사이트 작성자의 자격과 개인적 선호도에 따라 무작위 링크로만 상호 연결됩니다. 그러나 사용자는 이러한 다양성을 탐색하고 가급적이면 몇 분 안에 필요한 정보를 찾아야 합니다.

인터넷에는 많은 수의검색 엔진. 가장 보수적인 추정에 따르면 클래식을 포함하여 8,000개 이상이 있습니다. 검색 엔진, 일반 및 전문 카탈로그 , 그리고 메타서치 웹사이트(한 번에 여러 검색 서버에 요청을 보냅니다). 또한 다음을 포함하여 유용할 수 있는 다양한 대체 검색 도구가 있습니다. 브라우저와 함께 작동하여 웹에서 정보를 추출하는 유틸리티, 그리고 소위 "전문가 노드", 실제 사람들이 귀하의 요청을 처리하는 곳입니다. 현재 지능형 검색 시스템이 개발되고 있습니다. 그러한 시스템의 예로는 지능형 검색 시스템이 있습니다. 니그마(www.nigma.ru).

검색 엔진 및 디렉토리

인터넷에는 다양한 검색 방법이 있지만 정보를 찾는 가장 일반적인 수단은 여전히 ​​검색 엔진과 카탈로그입니다. 이러한 각 도구에는 특정 장점이 있으며, 이들 도구 간의 주요 차이점은 사람의 참여 여부입니다.

검색 엔진인터넷 검색을 위한 특별 프로그램 세트입니다.

주요 부분 소프트웨어 패키지:

1. 로봇 거미(거미). 색인 생성을 위해 대기 중인 사이트의 페이지를 반복하는 독립 실행형 프로그램입니다. 검색된 페이지의 내용을 검색 서버 디스크로 다운로드합니다.

2. 로봇 크롤러(“여행하는” 거미). 그 임무는 검사 중인 페이지의 모든 링크를 수집하고, 그 중에서 검색 엔진에 알려지지 않은 새로운 링크를 찾아 색인 생성을 기다리는 링크 목록에 추가하는 것입니다.

3. 인덱서.인덱싱을 위해 대기열의 페이지를 처리합니다. 이를 위해 그는 페이지의 "사전"을 작성하고 사용된 단어의 "빈도"를 기억합니다. 제목에 사용된 키워드를 강조하고 텍스트에서 강조 표시합니다. 굵은 글씨로. 다 넣어준다 특수 파일- "색인".


5. 요청을 처리하고 결과를 발행하는 시스템입니다.사용자의 요청을 수락하고, 데이터베이스에 대한 쿼리를 생성하고, 거기에서 결과를 받아 사용자에게 전송합니다.

검색 엔진시작하다 웹 소프트웨어페이지에서 페이지로 이동하고 각 페이지의 전체 텍스트에 대한 색인을 생성하는 "스파이더"입니다.

거의 모든 검색 엔진은 동일한 쿼리 형식과 결과 제공 형식을 거의 동일하게 사용합니다(' 단락 참조). 모습 검색 페이지"), 그러나 검색 엔진의 작동은 크게 다릅니다. 첫째, 관련성(검색 결과가 사용자의 요청과 일치하는 정도), 둘째, 데이터베이스 업데이트의 규모 및 빈도, 셋째, 결과 발행 속도입니다. 물론 검색 엔진마다 사용 편의성이 다릅니다.

오늘날 검색 엔진은 사용자가 많은 시간을 보내는 가장 인기 있는 웹 페이지입니다. 따라서 검색 엔진을 선택할 때 검색 엔진이 점점 더 중요해지고 있습니다. 관련 서비스(우편, 뉴스 피드, 거래 플랫폼등등.).

카탈로그- 정보를 정리하는 전통적인 수단. 우리 모두는 아마도 도서관 카탈로그와 제품 카탈로그를 접했을 것입니다. 디렉토리는 다양한 시스템에서 사용됩니다. 거의 모든 곳에서 정보를 저장하고 정리해야 합니다.

카탈로그 컴파일러가 직면하는 주요 과제 중 하나는 일반 사용자에게 자연스럽고 직관적인 카테고리를 만드는 것입니다. 안타깝게도, 이 작업다양한 정도의 근사를 통해서만 풀 수 있습니다. 세상은 연속적이며 엄격한 경계가 없습니다. 동일한 사이트를 다른 각도에서 볼 수 있으며 해당 사이트의 다른 기능을 볼 수 있습니다. 디렉토리는 페이지를 읽고, 부적절한 페이지를 제거하고, 주제별로 노드를 분류하는 인간 편집자에 의해 편집됩니다.

카탈로그의 단점은 다음과 같습니다.

첫째, 구조의 모호함은 정보 카탈로그 구성의 명백한 단점입니다(비록 모든 주요 카탈로그에 카탈로그 검색 기능이 있다는 사실로 인해 다소 완화되기는 하지만).

둘째, 카탈로그는 사람이 만듭니다. 카탈로그의 완성도와 품질은 카탈로그 작업을 하는 사람들의 수와 자격, 개인 취향과 선호도에 따라 달라집니다. 제목 내용의 불균일성은 모든 카탈로그의 특징입니다.

셋째, 수작업으로 분류하는 작업의 번거로움으로 인해 목록에 포함된 정보의 양이 제한됩니다.

동시에, 카탈로그의 확실한 장점은 그 안에 있는 정보가 기본적인 인간 논리와 규칙에 따라 질서 있게 저장된다는 것입니다. 관련성카탈로그에서 검색할 때 발견되는 페이지 수는 일반적으로 검색 엔진으로 검색할 때보다 훨씬 더 많습니다.

위에서 언급했듯이 디렉토리는 수동으로 생성되기 때문에 검색 엔진보다 훨씬 적은 리소스를 포함합니다. 보수적으로 추산하면 현재 웹에는 10억 페이지가 있습니다(그리고 그 수는 매일 백만 씩 증가하고 있습니다). 대부분의 검색 엔진은 전체 웹을 색인화하는 데 근접하지 못했습니다. 예외는 Google(러시아의 경우 www.google.ru)입니다. Google은 이 수치를 정확하게 주장합니다. 즉, 부분적으로 또는 전체가 색인에 포함된 10억 페이지입니다. 가장 큰 카탈로그인 오픈 디렉토리 프로젝트(www.dmoz.org)는 이러한 배경에 비해 아주 작아 보입니다. 여기에는 약 200만 페이지만 나열되어 있습니다.

1994년, 급속한 성장이 시작되던 해" 월드 와이드 웹", 인터넷에서 검색 도구의 선택은 매우 제한적이었습니다: Yahoo(www.yahoo.com). 이 서버는 오늘날까지 남아 있습니다. 기초웹 연구이지만 디렉토리로서 이제는 Open Directory Project와의 치열한 경쟁에 직면해 있습니다.

많은 디렉토리가 매우 유용하지만 모든 것을 고려하면 오픈 디렉토리 프로젝트가 선호되는 선택입니다. 프로젝트 오픈 Netscape가 시작한 디렉토리 프로젝트는 전 세계 24,000명 이상의 자원 편집자들이 운영하고 있으며 이들은 거의 200만 개의 노드를 색인화하고 이를 200,000개 이상의 범주로 분류했습니다. 모든 검색 서버는 오픈 디렉토리 프로젝트에 라이선스를 부여하고 쿼리를 처리할 때 해당 데이터베이스를 사용할 수 있으며, 대부분의 서버에서는 AltaVista(www.altavista.com), HotBot(www.hotbot.com), Lycos(www.lycos.co.uk) 및 약 100개의 다른 서버가 링크를 찾기 위해 그곳으로 다이빙합니다.

오픈 디렉토리 프로젝트는 자원 봉사자가 주도하는 디렉토리이기 때문에 결과의 질이 변동될 것으로 예상할 수 있습니다. 그러나 결과는 각 링크에 대한 명확한 설명과 함께 잘 구성된 관련 페이지 목록입니다. 오픈 디렉토리 프로젝트(Open Directory Project) 사이트는 Google과 같은 느낌을 갖고 있습니다. 즉, 상점 링크와 같은 방해 요소가 없는 "순수한 검색"입니다.

어떤 디렉토리를 선택하든 검색 엔진에 비해 한 가지 장점이 있습니다. 계층적 시스템메뉴.

소개..........................................................................................................................2

1 검색 엔진: 구성, 기능, 작동 원리

1.1 검색엔진의 구성 ..............................................................................3

1.2 검색엔진의 특징 ..............................................................4

1.3 검색 엔진의 원리 ..............................................4

2 검색 엔진 기능 개요

2.1 외국 검색 엔진: 구성 및 작동 원리..........12

2.2 러시아어 검색 엔진: 구성 및 작동 원리….…..14

결론..........................................................................................................16

참고문헌 목록...........................................................17

소개

검색 엔진은 다양한 수단을 통해 기본 소스 노드로부터 수신한 정보부터 사용자에게 검색 기능을 제공하는 정보 처리의 모든 단계를 독립적으로 제공한다는 사실 때문에 오랫동안 러시아 인터넷의 필수적인 부분이 되었습니다. 종종 불린다 자율 검색 엔진 시스템 .

검색 엔진은 이제 정보 검색 도구뿐만 아니라 비즈니스에 대한 유혹적인 영역을 나타내는 거대하고 복잡한 메커니즘입니다. 이러한 시스템은 자동 색인 알고리즘에 어느 정도 존재하는 정보 선택 원칙이 다를 수 있습니다. 스캐닝 프로그램 및 등록을 담당하는 카탈로그 직원의 행동 규칙. 일반적으로 두 가지 주요 지표가 비교됩니다.

IPS가 작동하는 공간 규모는 다음과 같습니다.

그리고 그녀의 전문 분야.

대부분의 검색 엔진 사용자는 검색 엔진 작동 원리, 사용자 요청 처리 체계, 이러한 시스템의 구성 및 작동 방식에 대해 생각해 본 적이 없습니다(또는 생각했지만 답을 찾지 못했습니다). 검색 엔진은 에이전트가 기업을 돌아다니며 정보를 데이터베이스에 수집하는 헬프 데스크에 비유할 수 있습니다. 서비스에 접속하면 이 데이터베이스에서 정보가 검색됩니다. 데이터베이스의 데이터는 오래된 것이므로 에이전트가 주기적으로 업데이트합니다. 일부 기업은 자체 정보를 보내므로 에이전트가 해당 기업에 올 필요가 없습니다. 다시 말해서, 안내 데스크데이터베이스에 데이터를 생성하고 지속적으로 업데이트하는 기능과 클라이언트의 요청에 따라 데이터베이스에서 정보를 검색하는 기능이 있습니다.

1 검색 엔진: 구성, 기능, 작동 원리

1.1 검색엔진의 구성

검색 시스템은 인터넷을 검색하고 텍스트 구문 형식으로 지정된 사용자 요청에 응답하도록 설계된 소프트웨어 및 하드웨어 복합체입니다. 검색어), (요청에 따라) 관련성 순으로 정보 출처에 대한 링크 목록을 발행합니다. 가장 큰 국제 검색 엔진: Google, Yahoo, MSN. 러시아 인터넷에서는 Yandex, Rambler, Aport가 있습니다.

마찬가지로 검색 엔진은 웹 서버를 크롤링하고 검색 엔진 데이터베이스를 생성하는 소위 로봇(또는 스파이더)이라는 두 부분으로 구성됩니다.

로봇의 기반은 주로 자체적으로 형성되며(로봇 자체가 새로운 리소스에 대한 링크를 찾습니다) 검색 엔진에 사이트를 등록하는 리소스 소유자에 의해 훨씬 덜 형성됩니다. 데이터베이스를 구성하는 로봇(네트워크 에이전트, 스파이더, 웜) 외에도 발견된 링크의 등급을 결정하는 프로그램이 있습니다.

검색 엔진의 작동 원리는 사용자가 쿼리 필드에 지정한 키워드에 대해 내부 카탈로그(데이터베이스)를 쿼리하고 관련성에 따라 순위가 매겨진 링크 목록을 생성하는 것입니다.

특정 사용자 요청을 처리할 때 검색 엔진은 내부 리소스를 기반으로 정확하게 작동하며(경험이 부족한 사용자가 흔히 생각하는 것처럼 웹을 통한 여정을 시작하지 않음) 내부 리소스는 당연히 제한된다는 점에 유의해야 합니다. 검색 엔진 데이터베이스가 지속적으로 업데이트된다는 사실에도 불구하고 검색 엔진은 모든 웹 문서를 색인화할 수 없습니다. 해당 문서의 수가 너무 많습니다. 따라서 찾고 있는 리소스가 특정 검색 엔진에 알려지지 않았을 가능성이 항상 있습니다.

1.2 검색엔진의 특징

진행 중 검색 과정네 단계로 표현됩니다: 공식화(검색이 시작되기 전에 발생); 작업(검색 시작); 결과 개요(사용자가 검색 후 보는 결과) 및 개선(결과를 검토한 후 동일한 요구 사항에 대한 다른 공식을 사용하여 검색으로 돌아오기 전). 보다 편리한 비선형 정보 검색 체계는 다음 단계로 구성됩니다.

자연어로 필요한 정보를 수정합니다.

필수 선택 검색 서비스특정 정보 검색 언어(IRL)로 정보 요구 사항을 기록하는 네트워크 및 정확한 형식화;

생성된 쿼리 실행

수신된 문서 링크 목록의 사전 처리 및 선택

필수 서류를 위해 선택한 주소에 연락합니다.

발견된 문서의 내용을 미리 봅니다.

나중에 연구하기 위해 관련 문서를 저장합니다.

쿼리 확장을 위해 관련 문서에서 링크를 추출합니다.

저장된 문서의 전체 배열을 연구합니다.

정보 요구가 완전히 충족되지 않으면 첫 번째 단계로 돌아갑니다.

1.3 검색 엔진의 작동 방식

모든 검색 엔진의 목표는 사람들이 찾고 있는 정보를 제공하는 것입니다. 사람들에게 "올바른" 요청을 하도록 가르치십시오. 검색엔진의 운영원리에 부합하는 검색어는 불가능합니다. 따라서 개발자는 사용자가 원하는 정보를 정확하게 찾을 수 있도록 하는 검색 엔진용 알고리즘과 작동 원리를 만듭니다. 이는 검색 엔진이 사용자가 정보를 검색할 때 생각하는 것과 동일한 방식으로 "생각"해야 함을 의미합니다.

대부분의 검색 엔진은 사전 색인 생성 원칙에 따라 작동합니다. 대부분의 검색 엔진의 데이터베이스는 동일한 원리로 작동합니다.

또 다른 건설 원칙이 있습니다. 직접 검색. 키워드를 검색하여 책을 페이지별로 넘기는 것으로 구성됩니다. 물론 이 방법은 효율성이 훨씬 떨어집니다.

반전된 인덱스 버전에서는 검색 엔진이 파일 크기 문제에 직면합니다. 일반적으로 크기가 상당히 큽니다. 이 문제는 일반적으로 두 가지 방법으로 해결됩니다. 첫 번째는 불필요한 모든 것이 파일에서 제거되고 검색에 실제로 필요한 것만 남게 된다는 것입니다. 두 번째 방법은 각 위치에 대해 절대 주소가 아닌 상대 주소를 기억하는 것입니다. 현재 위치와 이전 위치의 차이를 해결합니다.

따라서 검색 엔진이 수행하는 두 가지 주요 프로세스는 사이트 색인화, 페이지 색인화 및 검색입니다. 일반적으로 색인 생성 프로세스는 검색 엔진에 문제를 일으키지 않습니다. 문제는 하루에 백만 건의 요청을 처리하는 것입니다. 와 연결되어 있어요 대용량대규모 컴퓨터 단지에서 처리되는 정보. 주요 요인검색에 참여하는 서버의 수를 결정하는 가 검색 부하입니다. 이는 정보를 검색할 때 발생하는 몇 가지 이상한 점을 설명합니다.

검색 엔진은 5개의 개별 소프트웨어 구성 요소로 구성됩니다.

거미:웹 페이지를 다운로드하는 브라우저와 유사한 프로그램입니다.

무한 궤도:페이지에 있는 모든 링크를 자동으로 따라가는 "여행" 스파이더입니다.

인덱서:스파이더가 다운로드한 웹 페이지를 분석하는 "블라인드" 프로그램입니다.

데이터베이스:다운로드 및 처리된 페이지의 저장.

검색 엔진 결과 엔진(결과 전달 시스템):데이터베이스에서 검색 결과를 검색합니다.

거미:스파이더는 웹페이지를 다운로드하는 프로그램입니다. 웹사이트에 연결하고 페이지를 로드할 때 브라우저처럼 작동합니다. 거미에는 시각적 구성 요소가 없습니다. 특정 페이지를 볼 때와 브라우저에서 "HTML 코드 보기"를 선택할 때 동일한 동작(다운로드)을 관찰할 수 있습니다.

무한 궤도:스파이더가 페이지를 다운로드하는 것처럼 페이지를 제거하고 모든 링크를 찾을 수 있습니다. 링크를 기반으로 하거나 미리 결정된 주소 목록을 기반으로 스파이더가 다음에 어디로 가야 할지 결정하는 것이 이 작업입니다.

인덱서:인덱서는 페이지를 다양한 부분으로 구문 분석하고 분석합니다. 페이지 제목, 제목, 링크, 텍스트, 구조적 요소, 굵게 표시된 요소, ITALIC 요소 및 페이지의 기타 스타일 부분과 같은 요소를 격리하고 분석합니다.

데이터 베이스:데이터베이스는 검색 엔진이 다운로드하고 분석하는 모든 데이터의 저장소입니다. 이를 위해서는 막대한 자원이 필요한 경우가 많습니다.

찾다 엔진 결과:결과 시스템은 페이지 순위를 지정합니다. 사용자의 요청을 충족하는 페이지와 정렬 순서를 결정합니다. 이는 검색 엔진 순위 알고리즘에 따라 발생합니다. 이 정보는 우리에게 가장 가치 있고 흥미로운 것입니다. 최적화 프로그램이 상호 작용하여 검색 결과에서 사이트 위치를 향상시키려고 노력하는 것은 검색 엔진의 이 구성 요소이므로 앞으로는 영향을 미치는 모든 요소를 ​​자세히 고려할 것입니다. 결과 순위.

검색 색인은 세 단계로 작동하며, 그 중 처음 두 단계는 준비 단계이며 사용자에게 표시되지 않습니다. 먼저, 검색 색인은 다음에서 정보를 수집합니다. 세계 넓은 편물 . 이를 위해 그들은 사용합니다 특별 프로그램, 유사한 브라우저. 이들은 특정 웹 페이지를 검색 색인 서버에 복사하고, 스캔하고, 해당 리소스가 있는 모든 하이퍼링크를 찾고, 해당 리소스가 포함된 하이퍼링크를 다시 찾는 등의 작업을 수행할 수 있습니다. 유사한 프로그램~라고 불리는 벌레, 거미, 애벌레, 크롤러, 거미그리고 다른 유사한 이름. 각 검색 색인은 이 목적을 위해 자체 색인을 사용합니다. 독특한 프로그램, 그는 종종 스스로 발전합니다. 많은 최신 검색 엔진은 네트워크를 모니터링하는 자동 프로그램의 개발 및 구현과 관련된 실험 프로젝트에서 탄생했습니다. 이론적으로는 성공적인 진입으로 거미한 번의 다이빙으로 전체 웹 공간을 정리할 수 있지만 시간이 많이 걸리며 이전에 방문한 리소스에서 발생하는 변경 사항을 모니터링하고 "죽은" 링크, 즉 관련성을 잃었습니다.

검색 엔진

검색 엔진을 사용하면 특정 주제와 관련되거나 키워드 또는 키워드 조합이 포함된 WWW 문서를 찾을 수 있습니다. 검색 서버에는 두 가지 검색 방법이 사용됩니다.

· 개념의 계층 구조에 따라;

· 키워드별.

검색 서버는 자동 또는 수동으로 채워집니다. 검색 서버에는 일반적으로 다른 검색 서버에 대한 링크가 있으며 사용자의 요청에 따라 검색 요청을 보냅니다.

검색 엔진에는 두 가지 유형이 있습니다.

1. 중지 단어를 제외하고 웹 페이지의 모든 단어를 색인화하는 "전체 텍스트" 검색 엔진.

2. 각 페이지의 초록을 생성하는 "초록" 검색 엔진.

웹마스터의 경우 웹페이지에 있는 모든 단어를 분석하여 사용자 쿼리와의 관련성을 판단하므로 전체 텍스트 엔진이 더 유용합니다. 그러나 추상 엔진은 전체 텍스트 엔진보다 페이지를 더 잘 색인화할 수 있습니다. 이는 동일한 단어의 사용 빈도 등 정보를 추출하는 알고리즘에 따라 달라집니다.

검색엔진의 주요 특징.

1. 검색 엔진의 크기는 색인된 페이지 수에 따라 결정됩니다. 그러나 언제든지 사용자 요청에 따라 제공되는 링크의 연령이 다를 수 있습니다. 이런 일이 발생하는 이유:

· 일부 검색 엔진은 사용자 요청에 따라 페이지를 즉시 색인화한 다음 아직 색인화되지 않은 페이지를 계속해서 색인화합니다.

· 다른 사람들은 종종 가장 인기 있는 웹 페이지를 색인화합니다.

2.인덱싱 날짜. 일부 검색 엔진은 문서가 색인화된 날짜를 표시합니다. 이는 사용자가 문서가 온라인에 나타난 시기를 결정하는 데 도움이 됩니다.

3. 색인 깊이는 지정된 페이지 이후에 검색 엔진이 색인을 생성할 페이지 수를 보여줍니다. 대부분의 컴퓨터에는 인덱싱 깊이에 대한 제한이 없습니다. 일부 페이지의 색인이 생성되지 않는 이유:

· 프레임 구조의 잘못된 사용.

· 일반 링크를 복제하지 않고 사이트 맵 사용

4.프레임 작업. 검색 로봇이 프레임 구조 작업 방법을 모르는 경우 인덱싱 중에 프레임이 있는 많은 구조가 누락됩니다.

5. 링크 빈도. 주요 검색 엔진은 문서가 링크되는 빈도에 따라 문서의 인기를 결정할 수 있습니다. 일부 기계는 이러한 데이터를 기반으로 문서를 색인화할 가치가 있는지 여부를 "결론"합니다.

6.서버 업데이트 빈도. 서버가 자주 업데이트되면 검색 엔진은 해당 서버를 더 자주 다시 색인화합니다.

7. 인덱싱 제어. 검색 엔진을 제어하는 ​​데 사용할 수 있는 도구를 보여줍니다.

8.리디렉션. 일부 사이트는 방문자를 한 서버에서 다른 서버로 리디렉션하며, 이 옵션은 이것이 발견된 문서와 어떻게 관련되는지 보여줍니다.

9. 단어를 중지하십시오. 일부 검색 엔진은 색인에 특정 단어를 포함하지 않거나 사용자 쿼리에 해당 단어를 포함하지 않을 수 있습니다. 이러한 단어는 일반적으로 전치사 또는 자주 사용되는 단어로 간주됩니다.

10.스팸 벌금. 스팸 차단 기능.

11.오래된 데이터를 삭제합니다. 서버를 닫거나 다른 주소로 이동할 때 웹마스터의 조치를 결정하는 매개변수입니다.

검색 엔진의 예.

1. 알타비스타. 이 시스템은 1995년 12월에 문을 열었습니다. DEC가 소유합니다. 1996년부터 그는 Yahoo와 협력해 왔습니다. AltaVista는 맞춤 검색을 위한 최고의 옵션입니다. . 그러나 카테고리별로 결과를 정렬하면이는 완료되지 않았으며 제공된 정보를 수동으로 검토해야 합니다. AltaVista는 활성 사이트 목록, 뉴스 또는 기타 콘텐츠 검색 기능을 검색하는 수단을 제공하지 않습니다.

2.흥미로운 검색. 1995년 말에 출시되었습니다. 1996년 9월 - WebCrawler에 인수되었습니다. 이 유닛은 강력한 검색 모피를 가지고 있습니다.낮음, 자동 개별 설정 가능성제공된 정보와 수집된 자격자격을 갖춘 직원이 여러 노드에 대해 설명합니다.일으키다 다른 검색노드와 다른점은뉴스 서비스를 검색하고 리뷰를 게시할 수 있습니다.웹페이지. 검색 엔진은 도구를 사용합니다표준 키워드 검색 및 휴리스틱콘텐츠 검색 방법. 이 조합 덕분에관련 페이지를 찾을 수 있습니다편물, 사용자가 지정한 키가 포함되어 있지 않은 경우단어 익사이트의 단점 다소 혼란스러운 인터페이스입니다.

3.핫봇. 1996년 5월 출시. Wired 소유. Berkeley Inktomi 검색 엔진 기술을 기반으로 합니다. HotBot은 전체 텍스트 색인 문서가 포함된 데이터베이스이자 웹에서 가장 포괄적인 검색 엔진 중 하나입니다. 부울 검색 기능과 특정 영역이나 웹 사이트로 검색을 제한하는 기능은 사용자가 필요하지 않은 정보를 필터링하면서 필요한 정보를 찾는 데 도움이 됩니다. HotBot은 드롭다운 목록에서 원하는 검색 매개변수를 선택하는 기능을 제공합니다.

4.정보 탐색. 1995년 이전에 출시되었으며 쉽게 접근할 수 있습니다. 현재 약 5천만 개의 URL이 포함되어 있습니다. Infoseek은 잘 설계된 인터페이스와 뛰어난 검색 기능을 갖추고 있습니다. 쿼리에 대한 대부분의 응답에는 "관련 주제" 링크가 수반되며, 각 응답 뒤에는 "유사한 페이지" 링크가 따라옵니다. 전체 텍스트로 색인된 페이지의 검색 엔진 데이터베이스입니다. 답변은 두 가지 지표, 즉 페이지에 있는 단어나 문구의 출현 빈도에 따라 정렬됩니다. tsakh 및 페이지의 단어 또는 구문 위치.검색할 수 있는 수백 개의 하위 범주가 포함된 12개 범주로 구분된 웹 디렉토리가 있습니다. 각 카탈로그 페이지에는 재목록이 포함되어 있습니다. 추천 노드.

5. 라이코스. 1994년 5월부터 운영. 널리 알려져 사용되고 있습니다. 여기에는 수많은 URL이 포함된 디렉토리가 포함되어 있습니다. 전체 텍스트 색인이 아닌 페이지 콘텐츠의 통계 분석 기술을 갖춘 포인트 검색 엔진. Lycos에는 뉴스, 사이트 리뷰, 인기 사이트 링크, 도시 지도, 주소, 이미지를 찾는 도구가 포함되어 있습니다. 표현과 사운드, 비디오 클립.라이코스 상관관계 정도에 따라 답변을 정렬합니다.여러 기준(예: 숫자)을 기반으로 요청을 충족합니다.문서 초록에서 lu 검색어를 찾았습니다.멘션, 사이의 간격문서의 특정 문구의 단어, 위치문서의 용어.

6. 웹크롤러. 1994년 4월 20일 워싱턴 대학의 프로젝트로 개관했습니다. 웹크롤러 기회를 제공합니다쿼리를 지정하는 구문과 다양한 선택 항목 간단한 인터페이스를 사용한 노드 주석.


각 응답에 따라 WebCrawler는 요청이 일치했는지 여부를 대략적으로 평가한 작은 아이콘을 표시합니다. Comee는 또한 각 답변에 대한 간략한 요약, 전체 URL, 정확한 일치 점수가 포함된 페이지를 표시하고 다음을 사용합니다. 샘플 쿼리에서 이 답변을 키워드로 사용하세요.쿼리 구성을 위한 그래픽 인터페이스웹 크롤러가 없습니다. N 허용되지 않습니다보편적인 상징의 사용도 불가능하다키워드에 가중치를 부여합니다.검색 필드를 제한할 수 있는 방법이 없습니다.특정 지역.

7. 야후. 야후의 가장 오래된 디렉토리는 1994년 초에 출시되었습니다. 널리 알려지고 자주 사용되며 가장 존경받는 제품입니다. 1996년 3월, Yahooligans 어린이용 카탈로그가 출시되었습니다. Yahoo 지역 및 상위 디렉토리가 나타납니다. Yahoo는 사용자 구독을 기반으로 합니다. 분류 시스템은 사용자가 정보가 잘 정리된 사이트를 찾는 데 도움이 되므로 웹 검색의 출발점이 될 수 있습니다. 웹 콘텐츠는 14개의 일반 카테고리로 나누어져 있으며 Yahoo! 홈 페이지에 나열되어 있습니다. 사용자 쿼리의 세부 사항에 따라 이러한 범주를 사용하여 하위 범주 및 노드 목록을 탐색하거나 데이터베이스 전체에서 특정 단어 및 용어를 검색할 수 있습니다. 사용자는 Yahoo!의 섹션이나 하위 섹션 내에서 검색을 제한할 수도 있습니다. 노드의 분류는 사람이 수행한다는 사실로 인해컴퓨터가 아닌 경우 일반적으로 링크 품질이 매우 높습니다. 그러나 실패할 경우 검색을 세분화하는 것은 어려운 작업입니다. 야후에 가입하세요 ! 검색 엔진 포함 AltaVista에서 Yahoo! 그것은 자동으로 발생합니다 검색 엔진을 사용하여 반복알타비스타 . 결과는 다음으로 전송됩니다.야후!. 야후! 이메일 주소를 찾기 위해 Usenet 및 Fourl 1에 검색어를 보내는 기능을 제공합니다.

러시아어 검색 엔진에는 다음이 포함됩니다.

1. Rambler는 러시아어 검색 엔진입니다. Rambler 홈 페이지에 나열된 섹션은 러시아어 웹 리소스를 다룹니다. 정보 분류기가 있습니다. 편리한 기능은 각 노드에 대해 가장 많이 방문한 노드 목록을 제공하는 것입니다. 제안된 주제.

2. 공항 검색. 아포트 선도적인 인증 검색 엔진 중 하나로 선정마이크로소프트 지역 검색 엔진처럼러시아어 버전용 시스템마이크로소프트 인터넷 익스플로러. Aport의 장점 중 하나는 온라인 쿼리 및 결과 검색의 영어-러시아어 및 러시아어-영어 번역입니다. 덕분에 러시아어 인터넷 리소스에서 검색할 수 있습니다. , 러시아어를 몰라도. 게다가정보를 검색할 수 있어요 문장에도 표현을 사용합니다.Aport 검색 시스템의 주요 속성 중에서 다음을 수행할 수 있습니다.다음을 나눕니다.

쿼리 및 검색 결과를 러시아어에서 영어로 번역중국어와 그 반대;

요청의 철자 오류를 자동으로 확인합니다.

발견된 사이트에 대한 검색 결과의 정보 표시

어떤 문법 형태로든 검색할 수 있는 능력


전문가를 위한 고급 쿼리 언어 현금 사용자.

기타 검색 속성은 다음과 같습니다.5개의 주요 코드 페이지 지원(다른 운영 방식시스템) 러시아어의 경우 검색 기술을 사용하여아무런 제한이 없습니다 URL 문서 및 날짜, 검색 구현제목, 댓글, 서명으로사진 등에 검색 매개변수 저장 및 정의이전 사용자 요청 수, 병합 다른 서버에 있는 문서의 사본.

3. 목록. 루 ( http://www.list.ru) 구현 과정에서 이 서버에는 많은영어 시스템의 공통점야후!. 서버의 메인 페이지에는 가장 인기 있는 검색 카테고리에 대한 링크가 있습니다.


카탈로그의 주요 카테고리에 대한 링크 목록이 중앙 부분을 차지합니다. 카탈로그 검색은 쿼리 결과로 개별 사이트와 카테고리를 모두 찾을 수 있는 방식으로 구현됩니다. 검색에 성공하면 URL, 제목, 설명, 키워드가 표시됩니다. 허용되는 사용 Yandex 쿼리 언어. 와 함께링크 "구조카탈로그'는 별도의 창에서 전체 kata 카테고리를 엽니다.통나무. 루브리케이터에서 선택한 하위 카테고리로 이동하는 기능이 구현되었습니다. 좀 더 세부적인 주제별 구분현재 섹션은 링크 목록으로 표시됩니다.카탈로그는 이렇게 구성되어 있습니다 구조의 낮은 수준에 포함된 모든 사이트투어도 섹션별로 제공됩니다.표시된 리소스 목록은 알파벳순으로 정렬되지만 다음 기준으로 정렬하도록 선택할 수도 있습니다.메뉴 추가, 전환별,별 카탈로그에 추가하는 순서에 따라카탈로그 방문자 사이에서 인기가 높습니다.

4. 얀덱스. Yandex 시리즈 소프트웨어 제품은 러시아어의 형태를 고려하여 전체 텍스트 색인화 및 텍스트 데이터 검색을 위한 도구 세트를 나타냅니다. Yandex에는 형태학적 분석 및 합성, 인덱싱 및 검색을 위한 모듈은 물론 문서 분석기, 마크업 언어, 형식 변환기 및 스파이더와 같은 보조 모듈 세트가 포함되어 있습니다.

기본 사전을 기반으로 한 형태소 분석 및 합성 알고리즘은 단어를 정규화할 수 있습니다. 즉, 초기 형태를 찾을 수 있으며 기본 사전에 포함되지 않은 단어에 대한 가설도 구축할 수 있습니다. 전체 텍스트 색인 시스템을 사용하면 간결한 색인을 생성하고 논리 연산자를 사용하여 빠르게 검색할 수 있습니다.

Yandex는 로컬 및 글로벌 네트워크의 텍스트와 작동하도록 설계되었으며 다른 시스템에 모듈로 연결할 수도 있습니다.



질문이 있으신가요?

오타 신고

편집자에게 전송될 텍스트: