목차    

검색 속성 페이지

이 부록에서는 Sun Java System Identity Server 관리 콘솔을 통해 검색 엔진에 구성할 수 있는 속성을 설명합니다.

서비스 관리 보기에서 검색 등록 정보를 선택하면 탭으로 구성된 두 가지 톤의 메뉴 표시줄이 표시됩니다.이 부록은 메뉴 표시줄 상단 부분의 주제 또는 탭에 따라 정리되어 있습니다.

이들 탭 중 하나를 선택하면 아래 메뉴 표시줄에 해당 주제와 관련된 하위 주제가 나열됩니다.기본 검색 페이지는 서버/설정을 선택합니다.각 하위 주제는 하나 또는 여러 개의 탭을 사용하여 이 하위 주제에 대한 속성을 설명합니다.표는 속성, 기본값 및 설명의 3가지 열로 구성됩니다.속성은 페이지에 나타나는 설명적 텍스트를 제공하고 기본값은 속성의 기본값이며 설명은 속성과 그 형식을 설명합니다.

표 4의 설명처럼 각 검색 등록 정보 페이지에는 서버 선택 속성이 제공됩니다.

표 4 서버 선택 속성 검색

속성

기본값

설명

서버 선택

http://servername:80/portal

검색 서버의 완전한 정규 서버 이름.

서버

서버 부분에서는 서버의 기본 설정을 구성합니다.임시 파일에 사용할 디렉토리, 로깅할 정보 및 로그 내용의 세부적 정도를 선택합니다.서버 속성은 두 페이지에 표시됩니다.

설정

이 페이지에는 검색 서버의 관리 및 작동에 대한 기본적 설정 내용이 포함되어 있습니다.

표 5 서버 설정 속성 

속성

기본값

설명

서버 루트

/var/opt/SUNWps/https-servernamefull/portal

구성, 로그, 데이터베이스 및 로봇 정보 파일이 들어갑니다.검색을 수행할 때 생성되고 업데이트되는 모든 검색 파일에 대한 루트 디렉토리이기도 합니다.구성할 수 없습니다.

임시 파일

/var/opt/SUNWps/https-servernamefull/portal/tmp

검색 중에 검색을 관리하기 위해 사용되는 모든 임시 파일을 포함합니다.주 데이터베이스에 아직 추가되지 않은 새로 생성된 자원 설명도 포함됩니다.검색이 완료되면 제거됩니다.

문서 수준 보안

해제

문서에 액세스할 수 있는 사람을 통제합니다.

이 설정을 변경하면 서버를 다시 시작해야 합니다.

값:

  • 해제(기본값)는 모든 사용자가 RD에 액세스한다는 의미입니다.
  • 설정은 RD를 요청하는 사용자가 허용되는 조직이나 역할에 있거나 허용되는 개별 사용자로서 권한이 있는지 알아보기 위해 RD의 ReadACL 필드를 점검한다는 것을 의미합니다. ReadACL 필드는 [편집] 페이지의 [데이터베이스]에서 설정됩니다.

고급

이 페이지에는 검색 서버의 관리 및 작동에 대한 고급 설정 내용이 포함되어 있습니다.여기서 사용자 쿼리에 대한 로그 파일, 색인 유지 관리, 자원 설명 관리 및 디버깅을 구성합니다.

표 6 서버 고급 설정 속성

속성

기본값

설명

검색(RDM)

/var/opt/SUNWps/https-servername/portal/logs/rdm.log

데이터베이스에 대한 최종 사용자의 쿼리를 로깅합니다. [검색 로그 사용 안함] 확인란을 선택하여 이 로깅을 사용하지 않을 수 있습니다.

이 경우, 사용자 쿼리(rdm) 보고서를 볼 수 없습니다.

검색 로그 사용 안함

False(선택 해제) - 사용 설정

쿼리 로그의 사용을 제어합니다.

보고서 부분에서 이 로그를 바탕으로 가장 빈번한 쿼리가 나열된 보고서를 생성할 수 있습니다.

값:

  • 선택 - 사용 불가능
  • 선택 해제-사용 가능.이 로그에 모든 사용자 쿼리가 입력됩니다.

인덱스 유지 관리

/var/opt/SUNWps/https-servername/portal/logs/searchengine.log

자원 설명의 비등록을 제외하고 검색 엔진이 관련된 트랜잭션을 로깅합니다.

RD 관리자

/var/opt/SUNWps/https-servername/portal/logs/rdmgr.log

로봇이나 에이전트 가져오기로부터 자원 설명의 등록을 데이터베이스로 로깅합니다.이 로그를 RD 관리자(rdmgr) 보고서로 볼 수 있습니다.

RDM 서버

/var/opt/SUNWps/https-servername/portal/logs/rdmserver.log

RDM 트랜잭션에 대한 디버깅 정보를 로깅합니다.세부 수준은 로그 수준으로 제어합니다.이 로그를 RDM 서버(rdmsvr) 보고서로 볼 수 있습니다.

로그 수준

1

RDM 서버 로그 파일에 들어가는 세부 내용의 양을 제어합니다.

가능한 수준은 2, 10, 20, 50, 100 및 999입니다.

1(기본값)을 설정하면 심각한 오류만 로깅됩니다.숫자가 높을수록 RDM 서버 로그 파일에 자세한 내용이 담깁니다.

로봇

로봇에 대한 등록 정보는 상당히 복잡합니다.검색하거나 탐색할 사이트를 선택하고, 사이트가 유효한지 점검하고, 선택할 문서 유형을 정의하고, 검색이 이루어지는 일정을 정할 수 있습니다.

이 부분은 다음과 같이 구성되어 있습니다.

개요

로봇 개요 패널에서는 해제, 유휴, 실행 또는 일시 중지 중 로봇이 어느 상태에 있는지 알아보고 실행되고 있는 경우 패널이 약 30초마다 새로 고쳐지기 때문에 로봇의 검색 진행 상황을 살펴볼 수 있습니다.새로 고침 주기는 search.conf 파일에서 robot-refresh 매개 변수를 사용하여 정의합니다.

오른쪽 맨 위에 있는 두 개의 버튼이 이 상태에 해당합니다.로봇이 해제 상태이면 버튼이 시작 및 제거입니다.로봇이 실행 중이거나 유휴 상태이면 두 버튼이 중단 및 일시 중지입니다.로봇이 일시 중지 상태이면 두 버튼이 중단 및 계속입니다.어떤 속성을 선택하면 보고서 부분으로 이동하여 그 속성에 대한 최신 상세 보고서를 볼 수 있습니다.

표 7 로봇 개요 속성 

속성

기본값

설명

로봇

현재 활동

로봇의 상태.값은 유휴, 실행, 일시 중지 또는 해제가 될 수 있습니다.

업데이트 날짜

마지막으로 새로 고쳐진 날짜와 시간.

이 페이지는 로봇의 진행 상황을 알려주기 위해 새로 고쳐집니다.

시작 위치

정의된 수

검색할 것으로 선택한 사이트의 수.로봇, 사이트 페이지에서 사이트를 사용 해제합니다(검색에서 제외).

URL 풀

대기 URL 수

아직 검토해야 하는 URL 수.검색을 시작하면 시작 위치 URL이 URL 풀에 입력됩니다.검색이 진행됨에 따라 로봇이 다른 URL에 대한 링크를 발견합니다.이 URL은 풀에 추가됩니다.풀의 모든 URL이 처리된 후에는 URL 풀이 비워지고 로봇이 유휴 상태가 됩니다.

추출

초당 연결 수

1초에 살펴보는 자원 수.

추출은 데이터베이스에 포함될 자원, 문서 또는 하이퍼링크를 발견하거나 그 위치를 찾고 불필요한 항목을 걸러내는 과정입니다.

필터링

거부 URL 수

제외되는 총 URL 수.

인덱싱

초당 URL 수

초당 자원 설명으로 변환되는 자원이나 문서의 수.

인덱싱은 문서에서 수집된 모든 정보를 검색 데이터베이스에 포함시키기 위해 자원 설명으로 변환하는 과정입니다.

제외된 URL

필터로 제외된 URL 수

필터링 기준을 만족하지 않는 URL의 수.

 

오류로 제외된 URL 수

파일이 발견되지 않아 로봇에 오류가 발생한 URL의 수.

자원 설명

제공된 RD 수

데이터베이스에 추가된 자원 설명의 수.

 

제공된 RD 바이트 수

데이터베이스에 추가된 바이트 수.

일반 상태

검색된 URL 수

실행 중 검색된 URL 수.

 

RD의 평균 바이트 크기

각 자원 설명의 평균 바이트 수.

 

실행 일, 시간, 분 및 초

로봇이 실행되고 있는 시간 길이.

사이트

이 부분의 초기 페이지에는 검색 가능한 사이트가 표시됩니다.

라디오 단추를 사용하여 사이트를 활성화(On) 및 비활성화(Off)할 수 있습니다.비활성화된 사이트는 로봇이 실행될 때 검색되지 않습니다. [편집] 링크가 검색 사이트의 정의 방식을 변경할 수 있는 페이지를 표시합니다.

사이트를 삭제하려면 확인란을 선택하고 [삭제]를 선택합니다.

새 사이트를 추가하려면 [새로 만들기]를 선택합니다.텍스트 상자에 URL 또는 도메인을 추가하고 검색의 깊이를 선택합니다. [만들기]를 선택하여 기본값을 사용합니다.그렇지 않으면 [만들기 및 편집]을 선택하여 기본 이외 값을 선택하고 편집 페이지로 이동하여 검색 사이트를 정의합니다.

표 8 로봇 관리 사이트 속성

속성

기본값

설명

사이트의 상태

잠금 또는 클러스터
그래픽

잠금 열림은 URL에 액세스할 수 있다는 의미입니다.잠금 닫힘은 사이트가 보안 웹 서버이며 SSL을 사용한다는 의미입니다.클러스터는 사이트가 도메인이라는 것을 의미합니다.

설정/해제

설정

로봇이 실행될 때 이 사이트를 검색할지 여부를 선택합니다.

새 사이트 페이지에서 전체 사이트의 인덱싱을 설정할 수 있습니다.

표 9 로봇 새 사이트 속성

속성

기본값

설명

새 사이트

URL

URL - 형식:  http://www.sesta.com

도메인 - 형식:  *.sesta.com

깊이

10

이 URL에만 해당되는 경우 1, 이 URL과 첫 번째 링크에 해당되는 경우 2, 10 또는 무제한일 경우 3을 선택할 수 있습니다.로봇, 탐색 페이지에서 기본값을 설정합니다.

편집 페이지에서 검색 사이트를 더 완벽하게 정의할 수 있습니다.어떤 유형의 서버인지를 지정하고, 검색 깊이를 재정의하고, 검색 데이터베이스에 추가할 파일 유형을 선택할 수 있습니다. URL 및 도메인 사이트에 대한 속성은 대부분 동일합니다.이 표의 추가 열은 어떤 속성이 공유되는지 그리고 어떤 속성이 고유한지를 나타냅니다.

이 페이지에서 다양한 작업을 수행합니다.입력한 검색 사이트에 대한 서버 이름을 확인할 수 있습니다.서버 그룹 부분에서 추가를 선택하여 서버 그룹에 서버를 추가할 수 있습니다.시작 위치 부분에서 [추가]를 선택하여 시작 위치를 추가할 수 있습니다.필터 정의 부분에서 특정 유형의 파일을 추가 또는 삭제, 제외 또는 포함시키고 이러한 파일에 필터가 적용되는 순서를 변경할 수 있습니다.

표 10 로봇 사이트 편집 속성 

속성

URL/도메인

기본값

설명

사이트 별명

URL/D

입력한 사이트 - www.sesta.com

초기 페이지에 표시되는 이름.기본값은 입력한 URL 또는 도메인입니다.여기서 이 이름을 변경할 수 있습니다.

삭제나 확인을 위해 사이트를 선택하기 위한 확인란

URL/D

선택 해제

선택 해제 - 선택하지 않음

선택 - 선택

서버 그룹 - 이름

URL

URL - www.sesta.com

단일 서버이거나 단일 서버의 일부입니다.입력에 전체 호스트 이름을 포함시켜야 합니다.호스트 이름만을 지정하면 사이트가 이 호스트로만 제한됩니다.호스트 이름 외에 디렉토리 정보를 제공하면 사이트가 이 디렉토리와 그 하위 디렉토리에 있는 것으로만 정의됩니다.

도메인 접미어

D

입력 도메인 - *.sesta.com

*.sesta.com과 같이 도메인 내의 모든 서버를 포함합니다.

포트

URL/D

URL의 경우 80, 도메인의 경우
비워둠

검색하는 사이트가 다른 포트를 사용하면 여기에 그 포트를 입력합니다.

유형

URL

Web Server

웹 서버, 파일 서버, FTP 서버, 보안 웹 서버

허용된 프로토콜

D

모든 확인란 선택

http, 파일, ftp, https에 대한 확인란

시작 위치- 삭제를 위해
사이트를 선택할 확인란

URL/D

선택 해제

선택 해제 - 선택하지 않음

선택 - 선택

시작 위치- URL

URL/D

http:// URL:80

URL 또는 도메인

시작 위치 - 깊이

URL/D

10

1 - 이 URL만

2 - 이 URL과 첫 링크

3-10

무제한

필터 정의 - 삭제를 위해
파일 유형을 선택할 확인란

URL/D

선택 해제

선택 해제 - 선택하지 않음

선택 - 선택

필터 정의

URL/D

이 순서로 기본값은 아카이브 파일; 오디오 파일; 백업 파일; 이진 파일; CGI 파일; 이미지 파일; Java, Javascript, Style Sheet 파일; 로그 파일; 개정 제어 파일; 소스 코드 파일; 임시 파일; 비디오 파일.

 

가능한 선택은 아카이브 파일; 오디오 파일; 백업 파일; 이진 파일; CGI 파일; 이미지 파일; Java, Javascript, Style Sheet 파일; 로그 파일; 파워포인트 파일; 개정 제어 파일; 소스 코드 파일; 임시 파일; 비디오 파일; 스프레드시트 파일; 플러그인 파일; Lotus Domino 문서; Lotus Domino OpenViews; 시스템 디렉토리(UNIX); 시스템 디렉토리(NT).

주석

URL/D

없음

사이트를 설명하는 텍스트 필드.로봇이 사용하지 않습니다.

DNS 변환

URL

없음

DNS 변환을 통해 도메인 이름 또는 별칭을 cname으로 대체하여 URL과 그 탐색 방식을 수정합니다.형식: alias1->cname1,alias2->cname1

필터

이 부분의 초기 페이지에는 정의된 모든 필터 규칙과 이를 사용하는 사이트 정의가 표시됩니다.각 필터 이름 앞에는 그 문서 유형을 선택하기 위한 확인란과 필터 규칙을 사용 및 사용 해제하기 위한 두 개의 라디오 버튼이 있습니다.확인란을 선택하면 필터를 선택하고 삭제할 수 있습니다. [새로 만들기]를 선택하여 새 필터를 추가할 수 있습니다.새 필터 페이지는 간소화된 편집 페이지로서 별명과 하나의 규칙만 필요합니다.또 다른 옵션은 [편집] 링크를 선택하여 해당 파일 유형에 대한 규칙과 이 필터의 작동을 정의하는 페이지로 이동하는 것입니다.각 규칙은 필터 소소의 드롭다운 목록, 필터 기준에 대한 드롭다운 목록 및 구체적 필터 문자열을 입력하기 위한 텍스트 상자로 구성됩니다.

표 11 로봇 필터 편집 속성

속성

기본값

설명

필터 이름

새 이름을 묻습니다.편집하기로 선택한 파일 유형의 파일 이름.

필터가 적용되는 파일 유형을 반영하는 설명적 이름.

필터 소스의 드롭다운 목록

새 필터에 대한 URL.이 특정 파일 유형에 대해 이전에 선택한 정보를 표시합니다.

URL, 프로토콜, 호스트, 경로, MIME 유형

위치의 드롭다운 목록

새 필터의 경우 다음과 같음.이 특정 파일 유형에 대해 이전에 선택한 정보를 표시합니다.예를 들어 이진 파일은 exe로 끝납니다.

다음과 같음, 다음을 포함, 다음으로 시작, 다음 문자로 끝남, 일반 식

유형(디렉토리, 프로토콜, 파일 확장자) 세부 사항에 대한 텍스트 상자

새 필터의 경우 없음.이 특정 파일 유형에 대해 이전에 입력한 정보를 표시합니다.예를 들어 임시 파일에는 /tmp/가 있습니다.

이 텍스트 상자에 일치시킬 내용을 나열합니다.이 예에서 일치시킬 내용 - http://docs.sesta.com/manual.html

프로토콜은 http; 호스트에 sesta 포함; 파일이 html로 끝남.

설명

새 설명을 묻습니다.이 특정 파일 유형에 대해 이전에 입력한 설명을 표시합니다.

알기 쉽게 필터 규칙을 설명합니다.로봇은 설명을 사용하지 않습니다.

새 사이트

새 필터의 경우 True(선택).이 특정 파일 유형에 대해 이전에 선택한 값을 표시합니다.

새 사이트를 만들 때 이를 기본 필터 중 하나로 사용하십시오.선택하지 않아도 로봇, 사이트 페이지에서 사이트를 편집하여 이 필터를 새 사이트에 추가할 수 있습니다.

기본값으로

새 필터에 아무 것도 선택되지 않음.정의된 파일 유형에 대해 이전에 선택된 기본값.

이 필터와 일치하는 문서를 제외시킵니다.

이 필터와 일치하는 문서를 포함시킵니다.

새 필터에 대한 선택은 기존 사이트 정의에 영향을 미치지 않습니다.기존 사이트에서 새 필터를 사용하려면 로봇, 사이트 페이지에서 사이트를 편집하여 이를 추가해야 합니다.

배포

이 필터를 사용하는 사이트를 나열합니다.

 

탐색

이 페이지의 설정으로 로봇의 작업 매개 변수와 기본값을 관리합니다.다음 부분으로 구성되어 있습니다.속도, 완료 작업, 로그 파일 설정, 기준 준수, 인증 매개 변수, 프락시 처리, 고급 설정 및 링크 추출.

표 12 로봇 탐색 속성 

속성

기본값

설명

서버 지연

지연 없음

지연 없음(기본값), 1초, 2초, 5초, 10초, 30초, 1분, 5분.

최대 연결 - 최대 동시 검색 URL

8

1, 2, 4, 8(기본값), 10, 12, 16, 20.

사이트당 최대 연결

2

(제한 없음), 1, 2, 4, 8, 10, 12, 16, 20.

인덱싱에 대한 RD 전송
간격

30분

3분, 5분, 10분, 15분, 30분(기본값), 1시간, 2시간, 4시간, 8시간.

시작할 스크립트

없음(기본값)

없음(기본값).예를 들어 /opt/SUNWps/samples/robot 디렉토리(기본 설치의 경우)에 있는 cmdHook 파일을 참조하십시오.

모든 URL 처리 후

유휴 상태(기본값)

유휴 상태(기본값), 종료, 처음부터 다시 시작.

연락처 전자 메일

user@domain

자신의 전자 메일을 입력합니다.

로그 수준

1 - 생성

0 오류만; 1 생성(기본값); 2 열거, 변환; 3 필터링; 4 파생; 5 검색

사용자 에이전트

SunONERobot/6.0

검색 서버의 버전.

robots.txt 프로토콜 무시

False (선택 해제)

일부 서버에는 로봇에게 오지 말도록 알려주는 robot.txt 파일이 있습니다.검색 로봇이 사이트에서 이 파일과 마주치고 이 속성이 false이면 이 사이트를 검색하지 않습니다.이 속성이 true이면 로봇이 파일을 무시하고 사이트를 검색합니다.

인증을 수행하시겠습니까?

아니오

로봇 아이디

익명

로봇이 익명 사용자 이름을 사용하여 사이트에 액세스합니다.

비밀번호

user@domain

익명 사용자를 허용하는 사이트에서는 비밀번호로 전자 메일 주소를 요구하는 경우가 많습니다.이 주소는 일반 텍스트 형태입니다.

프락시 아이디

익명

로봇이 익명 사용자 이름을 사용하여 사이트에 액세스합니다.

비밀번호

user@domain

익명 사용자를 허용하는 사이트에서는 비밀번호로 전자 메일 주소를 요구하는 경우가 많습니다.이 주소는 일반 텍스트 형태입니다.

프락시 연결 유형

직접 인터넷 연결

직접 인터넷 연결, 프락시 — 자동 구성, 프락시 — 수동 구성

자동 프락시 구성 유형

로컬 프락시 파일

로컬 프락시 파일, 원격 프락시 파일

자동 프락시 구성 위치

없음

자동 프락시에는 필요한 모든 프락시 정보를 나열하는 파일이 있습니다.

로컬 프락시 파일의 예로 robot.pac가 있습니다.원격 프락시 파일의 예로 http://proxy.sesta.com:8080/proxy.pac가 있습니다.

수동 구성 HTTP 프락시

없음

형식: server1.sesta.com:8080 이 3가지 수동 구성 값은 /var/opt/SUNWps/https-servername/portal/config 디렉토리에 있는 robot.pac 파일에 들어갑니다.

수동 구성 HTTPS 프락시

없음

이 수동 구성 값은 robot.pac 파일에 들어갑니다.

형식: server1.sesta.com:8080

수동 구성 FTP 프락시

없음

이 수동 구성 값은 robot.pac 파일에 들어갑니다.

형식: server1.sesta.com:8080

HTML로 링크 따르기

True (선택)

HTML로부터 하이퍼링크 추출

최대 링크

1024

어떤 한 HTML 자원에서 로봇이 추출할 수 있는 링크 수를 제한합니다.로봇은 사이트를 검색하고 다른 자원에 대한 링크를 찾기 때문에 결국 원래 시작 위치에서 매우 멀리 떨어진 엄청난 수의 링크까지 이어질 것임을 쉽게 생각할 수 있습니다.

일반 텍스트로 링크 따르기

False (선택 해제)

일반 텍스트에서 하이퍼링크를 추출합니다.

최대 링크

1024

어떤 한 텍스트 자원에서 로봇이 추출할 수 있는 링크 수를 제한합니다.

쿠키 사용

False (선택 해제)

선택하는 경우 로봇이 탐색할 때 쿠키를 사용합니다.일부 사이트에는 올바른 탐색을 위해 쿠키를 사용해야 합니다.로봇은 쿠키를 로봇 상태 디렉토리의 cookies.txt라는 파일에 보관합니다.

cookies.txt의 형식은 Netscape™Communicator 브라우저에서 사용하는 것과 같은 형식입니다.

소스로 IP 사용

True (선택)

대부분의 경우 로봇은 자원의 도메인 이름에서만 작동합니다.어떤 경우에는 IP(Internet Protocol) 주소별 서브 네트에 따라 자원을 필터링하거나 분류해야 할 수 있습니다.이 경우, 로봇이 도메인 이름 외에 IP 주소를 검색할 수 있도록 명시적으로 허용해야 합니다. IP 주소 검색에는 추가적인 DNS 조회가 필요하기 때문에 로봇의 작동이 느려질 수 있습니다.이 옵션이 필요 없을 때는 해제하여 성능을 높일 수 있습니다.

스마트 호스트 검색

False (선택 해제)

선택하면 로봇이 서버에서 사용하는 공통 대체 호스트 이름을 단일 이름으로 변환합니다.이는 사이트에 다수의 서버가 있고 모두 보통 www1.sesta.com, www2.sesta.com 등의 이름을 갖는 www.sesta.com과 같이 동일한 주소로 별칭이 붙은 경우에 가장 유용합니다.

이 옵션을 선택하면 내부적으로 로봇이 wwwn으로 시작되는 모든 호스트 이름을 www로 변환합니다.여기서 n은 정수입니다.이 속성은 wwwn으로 시작되는 호스트 이름에서만 작동합니다.

CNAME 설정이 해제(false)인 경우에는 이 속성을 사용할 수 없습니다.

CNAME으로 호스트 이름 결정

False (선택 해제)

선택하는 경우, 로봇은 마주치는 모든 호스트 이름을 검증하여 정식 호스트 이름으로 결정합니다.이를 통해 로봇이 고유한 RD를 정확하게 추적할 수 있습니다.선택하지 않으면, 로봇이 호스트 이름을 검증하지만 정식 형태로 변환하지 않습니다.따라서 로봇이 서로 다른 호스트 이름을 가진 중복된 RD를 발견할 수 있습니다.

예를 들어 devedge.sesta.comdeveloper.sesta.com에 대한 별칭입니다. CNAME 결정이 설정된 상태에서 devedge.sesta.com으로 참조된 URL은 developer.sesta.com에서 발견되는 것으로 나열됩니다. CNAME 결정이 해제된 상태에서는 RD가 devedge.sesta.com에 대한 원래 참조를 유지합니다.

CNAME 결정이 해제(false)일 때는 스마트 호스트 검색을 사용할 수 없습니다.

모든 호스트의 명령 허용

False (선택 해제)

대부분의 로봇 제어 함수는 TCP/IP 포트를 통해 작동합니다.이 속성은 로봇에 대한 명령의 출처가 로컬 호스트 시스템이어야 하는지(false) 또는 네트워크의 어디서나 올 수 있는지(true)를 제어합니다.

직접 로봇 제어를 로컬 호스트로 제한(false)하는 것이 좋습니다.그래도 관리 콘솔을 통해 로봇을 원격으로 관리할 수 있습니다.

기본 시작 위치 깊이

10

1- 시작 위치만, 2- 책갈피 스타일, 3-10, 무제한.

어떤 시작 위치에서 로봇이 들어가는 하이퍼링크 수준에 대한 기본값.로봇, 사이트 페이지에서 사이트를 편집하여 어떤 주어진 시작 위치에 대한 깊이를 설정할 수 있습니다.

작업 디렉토리

/var/opt/SUNWps/https-servernamefull/portal/tmp

로봇이 데이터를 저장하는데 사용할 수 있는 임시 작업 디렉토리의 완전한 경로 이름.로봇은 문서의 전체 컨텐트를 이따금 대량으로 이 디렉토리로 가져와 이 공간이 이러한 모든 컨텐트를 한 번에 처리하기에 충분히 커지도록 합니다.

상태 디렉토리

/var/opt/SUNWps/https-servernamefull/portal/robot

로봇이 그 상태 정보를 저장하기 위해 사용하는 임시 디렉토리의 전체 경로 이름.여기에는 방문한 URL 목록, URL 풀 등이 포함됩니다.이 데이터베이스는 매우 클 수 있기 때문에 작업 디렉토리와 분리된 파티션에 놓는 것이 좋습니다.

인덱싱

로봇은 선택한 사이트를 검색하고 선택한 필터를 기준으로 문서를 수집합니다.수집되는 문서는 매우 다양한 형식입니다.이들을 균일하고 쉽게 판독할 수 있게 하려면 하나의 형식 즉, HTML 형식이 되어야 합니다.이 페이지는 각 자원 설명으로 이동하는 일부분을 제어합니다.

표 13 로봇 인덱스 속성 

속성

기본값

설명

전체 텍스트 또는 부분
텍스트

일부 텍스트

전체 텍스트는 자원 설명에서 전체 문서를 사용합니다.일부 텍스트는 자원 설명에서 지정된 바이트 수만 사용합니다.

처음 # 바이트 추출

4096

바이트 수를 입력합니다.

목차 추출

True (선택)

True에는 자원 설명의 목차가 포함됩니다.

META 태그의 데이터 추출

True (선택)

True에는 자원 설명의 META 태그가 포함됩니다.

문서 변환기

모두 선택(true); false인 경우, 이
문서 유형은 인덱싱할 수 없습니다.

Adobe PDF

Corel Presentations

Corel Quattro Pro

FrameMaker

Lotus Ami Pro

Lotus Freelance

Lotus Word Pro

Lotus 1-2-3

Microsoft Excel

Microsoft Powerpoint

Microsoft RTF

Microsoft Word

Microsoft Works

Microsoft Write

WordPerfect

StarOffice™ Calc

StarOffice™ Impress

StarOffice™ Writer

XyWrite

변환기 시간 초과

600

하나의 문서를 HTML로 변환하는데 허용된 시간(초).이 시간이 초과되는 경우 URL이 제외됩니다.

시뮬레이터

이 페이지는 URL에 대한 로봇 필터링의 일부 시뮬레이션을 수행하는 디버깅 도구입니다.점검할 새 URL을 입력할 수 있습니다. URL, DNS 변환( 스마트 호스트 검색 포함) 및 사이트 리디렉션 여부를 검사합니다. URL에 의해 지정된 문서의 컨텐트를 점검하지 않기 때문에 중복, MIME 유형, 네트워크 오류, 권한 등을 찾아내지 않습니다.시뮬레이터는 나열한 사이트가 로봇에 의해 허용(ACCEPTED)되는지 여부를 표시합니다.

표 14 로봇 시뮬레이터 등록 정보

속성

기본값

설명

URL

이미 정의한 URL과 하나의 빈

텍스트 상자.

빈 텍스트 상자에 새 사이트의 URL을 입력하여 이 사이트에 대한 액세스를 점검할 수 있습니다.이는 새 사이트가 탐색을 허용하는지 알아보기 위한 것입니다.

형식 http://www.sesta.com:80/

DNS 별칭 점검

True (선택)

True(선택)는 동일 주소에 대한 별칭을 사용하는 서버의 수를 확인합니다.

서버 리디렉션 점검(302)

True (선택)

True(선택)는 서버 리디렉션을 확인합니다.

사이트 시험

이 페이지는 DNS 별칭, 서버 리디렉션 및 가상 서버를 점검하는 디버깅 도구입니다.이 도구는 사이트에 대한 정보를 반환하지만 탐색을 허용하는지 테스트하지 않습니다.

표 15 로봇 사이트 시험 속성

속성

기본값

설명

사이트

없음

http://www.sesta.com:80 형식으로 URL을 입력합니다.

고급 DNS 정보 표시

False (선택 해제)

True(선택)는 IP 주소를 포함하여 사이트에 대한 추가 정보를 표시합니다.

데이터베이스

데이터베이스 속성은 다음으로 세분됩니다.

관리

초기 관리 페이지에는 사용 가능한 데이터베이스가 나열됩니다.새 데이터베이스를 만들거나, 다시 인덱싱하거나, 제거하거나 기존 데이터베이스를 만료할 수 있습니다.확인란을 사용하여 작업을 수행할 데이터베이스를 선택합니다.확인란 위의 작은 아이콘을 사용하여 모든 데이터베이스를 선택 또는 선택 해제합니다.다시 인덱싱, 제거 또는 만료를 선택하는 경우 데이터베이스 이름 목록과 함께 작업을 수행할 것인지를 확인하는 프롬프트가 표시됩니다.작업을 수행하려면 [OK]를 선택합니다.

인덱싱된 필드를 추가하거나 제거하기 위해 스키마를 편집했거나(작성자로) 디스크 오류로 인덱스가 손상된 경우에는 데이터베이스를 다시 인덱싱해야 합니다.

데이터베이스를 다시 인덱싱하는 데 필요한 시간은 데이터베이스에 있는 RD의 수에 비례하기 때문에 대용량 데이터베이스는 서버 사용량이 많지 않을 때 다시 인덱싱해야 합니다.

데이터베이스의 컨텐트를 제거하는 경우, 인덱스에 사용된 디스크 공간이 복구되지만 주 데이터베이스에서 사용하는 디스크 공간은 복구되지 않고 데이터베이스에 추가되는 새 데이터에 다시 사용됩니다.

데이터베이스를 만료하면 만기가 경과된 것으로 취급되는 모든 RD가 삭제됩니다.이것으로 데이터베이스 크기가 줄어들지 않습니다.기본적으로 RD는 만든 날로부터 90일 후에 만료되도록 일정이 계획됩니다.

[편집] 링크를 선택하여 데이터베이스 속성을 정의하는 페이지로 이동하여 데이터베이스를 편집할 수도 있습니다.

표 16 데이터베이스 관리 속성

속성

기본값

설명

이름

기본값

검색에 사용되는 데이터베이스의 이름.

제목

없음

데이터베이스의 제목.

설명

없음

알기 쉽게 데이터베이스를 설명합니다.

에이전트 가져오기

에이전트 가져오기는 다른 서버나 데이터베이스로부터 자원 설명을 가져와 이들을 검색 데이터베이스로 병합하는 과정입니다.

초기 가져오기 페이지에는 사용 가능한 에이전트 가져오기가 나열됩니다.새 에이전트 가져오기를 생성 또는 실행하거나 기존 에이전트 가져오기를 편집 또는 삭제할 수 있습니다.확인란을 사용하여 삭제할 에이전트를 선택합니다.확인란 위의 작은 아이콘을 사용하여 모든 에이전트 가져오기를 선택 또는 선택 해제합니다.에이전트 작업을 사용 또는 사용 해제할 때는 라디오 버튼을 사용합니다.에이전트 가져오기의 일정을 계획하려면 하단 메뉴 표시줄에서 [일정]을 선택합니다.

기존 에이전트 가져오기를 편집 또는 수정하거나 새 에이전트 가져오기를 만들기로 선택하면 다음 속성이 표시됩니다.

표 17 데이터베이스 에이전트 가져오기 속성 

속성

기본값

설명

다음에서 가져오기

로컬 파일

로컬 파일 또는 검색 서버를 선택합니다(하나가 설정된 경우).

로컬 파일 경로

신규의 경우 없음

SOIF(Summary Object Interchange Format)의 유효한 자원 설명이 있는 로컬 파일의 전체 경로 이름을 제공합니다.로컬로 마운트된 것처럼 경로 주소를 지정할 수만 있다면 이는 또 다른 서버의 파일일 수 있습니다.

데이터베이스 이름

기본값

대상 데이터베이스의 이름.

원격 서버

 

신규의 경우 없음

자원 설명을 검색해올 검색 서버의 URL을 제공합니다.형식 http://www.sesta.com:80

인스턴스 이름

신규의 경우 없음

검색 서버가 사용하는 서버 인스턴스 이름.가져오고 있는 출처 서버의 서버 기본 설정에 이 인스턴스 이름이 나와 있습니다.값은 3.01C 또는 3.01C SP1이어야 합니다.

URI 검색

신규의 경우 없음

전체 경로 및 파일 이름을 입력합니다.
/portal/search를 사용합니다.

Compass Server 3.01X입니까?

False (선택 해제)

 

가져오고 있는 출처 서버가 Compass Server 3.01X입니까?

SSL 사용

False (선택 해제)

서버 간의 트랜잭션의 경우 서버가 SSL(Secure Sockets Layer) 프로토콜을 사용해야 하는 것으로 선택하십시오.

인증

없음(기본값)

없음(기본값) 또는 사용자/비밀번호 사용

에이전트 가져오기가 가져오는 출처 시스템에 자신을 어떻게 확인시켜야 하는지를 지정합니다.기본적으로 인증이 사용되지 않습니다.가져올 출처 서버에 인증이 필요한 경우 에이전트 가져오기가 사용할 사용자 이름과 비밀번호를 지정할 수 있습니다. 3.01C로부터 가져오기에는 인증이 필요 없습니다. 3.01C SP1로부터 데이터 가져오기에는 인증이 필요합니다.

사용자

신규에 없음 또는 없음

사용자/비밀번호를 선택한 경우 사용자를 입력합니다.

비밀번호

신규에 없음 또는 없음

사용자/비밀번호를 선택한 경우 비밀번호(*로 표시)를 입력합니다.

컨텐트 전달

전체 컨텐트의 증분 수집 사용(기본값)

전체 컨텐트의 증분 수집 사용 또는 검색 쿼리 사용을 선택

이것으로 소스에서 어떤 자원 설명을 가져올지 지정합니다.

기본적으로 에이전트 가져오기는 동일 소스에서 마지막으로 가져오기 한 이후 추가되거나 변경된 모든 자원 설명을 요청합니다.

검색 쿼리는 에이전트 가져오기가 소스로부터 특정 자원 설명만 요청해야 한다고 지정합니다.이는 사용자가 검색 데이터베이스로부터 자원 목록을 요청하는 것과 매우 비슷합니다.

범위, 보기 속성 및 적중 결과 보기 필드에서 쿼리를 지정합니다.

범위

신규의 경우 없음

쿼리의 텍스트.쿼리 구문은 서버에서 최종 사용자에 사용되는 것과 동일합니다.

속성 보기

신규의 경우 없음

각 자원 설명에서 어떤 필드(대소문자 구분 안 함)를 가져올 것인지를 나열합니다.예를 들면 제목 및 작성자입니다.기본값은 모두입니다.

적중 결과 보기

신규의 경우 없음

가져올 일치 자원 설명의 최대 수.적중 결과가 지정되지 않으면 20이 기본값이 됩니다.

에이전트 설명

신규의 경우 없음

초기 가져오기 페이지에서 사용 가능 에이전트 가져오기 목록에 나타납니다.프로그램에서는 이를 무시합니다.이 필드를 비워두면 에이전트 가져오기를 확인하기 위해 자원 설명 소스 파일 이름 또는 서버 이름이 사용됩니다.사용자 이름 및 비밀번호가 필요한 경우 여기를 참고하십시오.

최근 리소스 설명

신규의 경우 없음

이 에이전트 가져오기에 의해 이전에 가져와진 최신 자원 설명의 생성 날짜.이 날짜는 전체 컨텐트의 증분 수집 사용 옵션에서 어떤 자원이 신규이며 가져와야 하는지를 결정하기 위해 사용됩니다.

네트워크 시간 초과(초)

신규의 경우 없음

네트워크에서 연결 시간이 초과될 때까지 가져오기 에이전트가 허용하는 시간(초)을 지정합니다.네트워크의 변화하는 트래픽과 품질에 대응하도록 이를 조절할 수 있습니다.

문자 집합

신규의 경우 없음

입력 SOIF 스트림의 문자 집합을 지정합니다.예를 들면 ISO8859-1, UTF-8, UTF-16 등과 같습니다. ISO8859-1에서 ISO8859-15까지의 문자 집합이 지원됩니다.

자원 설명

초기 자원 설명 페이지에서 데이터베이스의 자원 설명을 검색할 수 있습니다.예를 들어, RD에서 오타를 수정하거나 로봇이 발견한 RD를 범주에 직접 할당할 수 있습니다.

표 18 자원 설명 속성

속성

기본값

설명

찾을 내용

모든 RD

모든 RD, 분류되지 않은 RD, 분류된 RD, 범주별 RD, URL별 특정 RD, 다음을 포함하는 RD

텍스트 상자

없음

검색할 RD를 구분하는 고유 텍스트 문자열을 입력합니다.범주별 RD, URL별 특정 RD 및 속성 값을 포함하는 RD와 함께 사용합니다.

데이터베이스

기본값

검색할 데이터베이스 이름.

범주별 검색을 제한하려면 [범주 선택]을 선택합니다.검색을 위한 분류법에서 범주를 지정할 수 있는 범주 편집기 페이지가 나타납니다.
[선택한 범주] 텍스트 상자에서 범주를 지정하거나 분류법을 탐색하여 선택할 수 있습니다.범주를 지정한 후에는 [OK]를 선택하여 RD 검색 페이지로 돌아갑니다.

표 19 범주 편집기 속성

속성

기본값

설명

선택한 범주

없음

범주를 입력하는 텍스트 필드입니다.

모두 확장

 

계층의 모든 항목을 탐색하도록 표시하기 위해 분류법을 확장합니다.

모두 축소

없음

계층의 처음 두 수준에 있는 범주만 탐색을 위해 표시되도록 분류법을 축소합니다.

페이지당 범주 수

25

페이지당 표시할 범주 수의 드롭다운 목록.값은 25, 50, 100, 250, 500 및 모두입니다.

검색이 성공적으로 이루어지면 찾은 RD 수와 찾은 RD를 나열하는 텍스트 상자가 표시됩니다.하나를 선택하면 편집이 가능한 다음 속성과 RD의 텍스트 일부가 표시됩니다.분류를 제외하고 이 모든 속성은 데이터베이스/스키마 페이지에서 편집할 수 있도록 설정됩니다.

표 20 데이터베이스 RD 편집 가능 속성 

속성

기본값

설명

분류

선택한 RD의 범주 이름.

분류된 경우 범주 이름, 분류되지 않은 경우 분류 없음.

ReadACL

없음

문서 수준 보안에 관련.

설명

선택한 RD로부터의 설명.

RD로부터의 설명.

키워드

있는 경우 선택한 RD로부터의
키워드.

메타 태그에서 가져온 키워드.

제목

선택한 RD의 제목.

RD의 제목

스키마

스키마는 자원 설명에 어떤 정보가 있고 이 정보가 어떤 형태인지를 결정합니다. RD에 새 속성이나 필드를 추가하고 편집 및 인덱싱이 가능한 것을 설정할 수 있습니다.새 RD를 가져오는 경우 새 RD에 내장된 스키마를 고유 스키마로 변환할 수 있습니다.

표 21 데이터베이스 스키마 편집 속성 

속성

기본값

설명

이름

없음

선택된 스키마 이름: Author, Author-EMail, Content-Charset, Content-Encoding, Content-Language, Content-Length, Content-Type, Description, Expires, Full-Text, Keywords, Last-modified, Partial-Text, Phone,ReadACL, Title, URL

설명

없음

이러한 설명은 위에 나열된 스키마와 일치합니다. 이 텍스트 상자에는 사용자의 의견을 입력합니다.검색 서버는 이 속성을 사용하지 않습니다.

문서의 작성자.

문서의 작성자에게 연락하기 위한 전자 메일 주소.

HTTP 서버의 컨텐트 문자 집합 정보.

HTTP 서버의 컨텐트 인코딩 정보.

HTTP 서버로부터의 컨텐트 언어 정보.

HTTP 서버로부터의 컨텐트 길이 정보.

HTTP 서버로부터의 컨텐트 유형 정보.

문서에 대한 간략한 한 줄 설명.

자원 설명이 더 이상 유효하지 않은 날짜.

문서의 전체 컨텐트.

문서를 가장 잘 설명하는 키워드.

문서가 마지막으로 수정된 날짜.

문서에서 텍스트의 일부 선택.

작성자 연락을 위한 전화 번호.

검색 서버에서 보안을 강화하기 위해 사용.

문서의 제목.

문서의 일관된 자원 로케이터 또는 웹 주소.

별칭

이름

설명

없음

새 RD를 가져오는 경우 새 RD에 내장된 스키마를 고유 스키마로 변환할 수 있습니다.가져오기 데이터베이스 스키마와 데이터베이스의 RD에 사용된 스키마의 필드에 사용된 이름 사이에 불일치가 있을 때 이 변환을 사용합니다.작성자에 대한 필드로 Writer를 사용하는 RD를 가져오고 이 작성자에 대한 필드로 RD에서 Author를 사용한 경우를 예로 들 수 있습니다.변환은 Writer에서 Author로 이루어지므로 이 텍스트 상자에 Writer를 입력합니다.

데이터 유형

문자열

데이터 유형을 정의합니다.

편집 가능

False (선택 해제)

true(선택)인 경우, 선택한 속성(필드)이 데이터베이스 RD 편집기에 나타나 그 값을 변경할 수 있습니다.

설명, 키워드, 제목 및 ReadACL은 편집 가능합니다.

인덱싱 가능

True

true(선택)인 경우, 선택한 속성(필드)을 인덱싱의 기초로 사용할 수 있습니다.

최종 사용자를 위해 고급 검색 화면의 메뉴에 작성자, 제목 및 URL이 표시됩니다.이를 통해 최종 사용자는 이러한 특정 필드에서 값을 검색할 수 있습니다.

작성자, 만료, 키워드, 최종 수정일, 제목, URL 및 ReadACL을 인덱싱을 위한 기초로 사용할 수 있습니다.

점수 승수

1.0

특정 요소의 점수를 매기기 위한 가중 필드.양의 값이면 모두 유효합니다.

분석

분석 페이지에서는 현재 검색 데이터베이스에 있는 모든 사이트의 정렬된 목록과 해당 사이트의 리소스 수를 보여줍니다.파일에 대한 분석을 업데이트하려면 [분석 업데이트]를 선택합니다.

표 22 데이터베이스 분석 속성

속성

기본값

설명

RD 총 개수

데이터베이스에 있는 현재 RD 수.

데이터베이스에 있는 총 자원 설명의 현재 수를 나열합니다.

서버 수

데이터베이스의 파티션이 걸쳐있는 서버의 현재 수.

데이터베이스는 다수의 서버에서 분할된 파티션에 있을 수 있습니다.

사이트

로봇이 성공적으로 검색한 URL 또는 도메인.

데이터베이스에 자원 설명을 추가한 URL 또는 도메인.

RD 개수

이 사이트로부터의 현재 RD 수.

이 사이트로부터의 현재 RD 수를 나열합니다.

유형

RD 유형

자원 설명은 예를 들어 http와 같이 다양한 유형일 수 있습니다.

백분율

RD 유형/총 RD 수

총 자원 설명 수와 비교한 이 문서 유형의 백분율.

범주

최종 사용자는 두 가지 색다른 방식으로 검색 데이터베이스와 상호 작용합니다.데이터베이스 검색을 위한 쿼리를 직접 입력하거나 설계한 범주 집합을 사용하여 데이터베이스 컨텐트를 찾아볼 수 있습니다.복잡성을 없애기 위해 검색 데이터베이스의 자원에 범주를 할당합니다.데이터베이스에 매우 많은 항목이 있으면 이를 관련 항목으로 그룹화하는 것이 도움이 됩니다.범주를 설정할 때 주요 관심사는 최종 사용자가 특정 항목을 신속하게 찾을 수 있도록 사용 편이성을 높이는 것입니다.

검색 서버는 분류법이라고 하는 범주 계층을 사용합니다.분류법이라는 용어는 일반적으로 어떤 범주 시스템을 설명합니다.검색 서버 데이터베이스와 같이 네트워킹된 자원 데이터베이스의 상황에서 이는 원활한 검색을 위해 네트워크 자원의 범주화로 선택하는 방법을 설명합니다.

범주 주제는 다음 하위 주제로 세분됩니다.

범주 편집기

범주 편집기 페이지에는 범주를 찾아볼 수 있도록 분류법으로 범주가 나열되어 있습니다.범주를 찾은 후에 범주 링크를 선택하면 분류 규칙 편집기가 열려 특정 범주 하에서 로봇 수집을 설정할 수 있습니다.

표 23 범주 편집기 속성

속성

기본값

설명

모두 확장

 

계층의 모든 항목을 탐색하도록 표시하기 위해 분류법을 확장합니다.

모두 축소

 

계층의 처음 두 수준에 있는 범주만 탐색을 위해 표시되도록 분류법을 축소합니다.

다시 인덱싱

 

데이터베이스를 다시 인덱싱합니다.방금 분류법을 만들었으면 최종 사용자가 범주 검색을 이용할 수 있게 데이터베이스를 인덱싱해야 합니다.범주를 변경했으면 데이터베이스를 다시 인덱싱하여 최신 상태를 유지해야 합니다.데이터베이스를 다시 인덱싱하기 전에 범주 트리를 저장하십시오.

페이지당 범주 수

25

페이지당 표시할 범주 수의 드롭다운 목록.값은 25, 50, 100, 250, 500 및 모두입니다.

이름

선택한 범주

편집할 범주의 이름

설명

없음

범주에 대한 설명

일치 규칙

없음

사용할 대조 규칙

업데이트

 

범주 정의를 업데이트합니다.

하위 항목으로 추가

 

범주를 하위 항목으로 추가합니다.

형제 항목으로 추가

 

범주를 형제 항목으로 추가합니다.

분류 규칙 편집기

데이터베이스에 범주를 설정한 후에는 이 페이지를 사용하여 로봇이 자원을 범주에 할당할 때 사용하는 규칙을 설정하거나 변경합니다.

표 24 범주 분류 규칙 편집기 속성

속성

기본값

설명

소스

선택

작성자, 작성자-이메일, 컨텐트-문자 집합, 컨텐트-인코딩, 컨텐트-언어, 컨텐트-길이, 컨텐트-유형, 설명, 만료, 전체 텍스트, 키워드, 최종 수정, 부분 텍스트, 전화, ReadACL, 제목, URL, 호스트, 프로토콜, uri, ip, 경로, 유형

메서드

다음과 같음

다음과 같음, 다음을 포함, 다음으로 시작, 다음 문자로 끝남, 일반 식

기준

없음

규칙에 대한 기준을 지정합니다.

분류

없음

규칙 조건이 만족되는 경우 RD를 분류할 범주.범주를 입력하거나 범주 선택 편집 페이지를 사용하여 이를 찾아봅니다.

자동 분류

이 페이지는 자동 분류 기능을 관리합니다.

표 25 범주 자동 분류 속성

속성

기본값

설명

로그 경로

 

자동 분류를 사용하는 로그 파일의 위치

메모리에 있는 자원 설명

10000

메모리에 저장되어 있는 자원 설명을 위한 캐시 크기.수집된 자원 설명이 특정 크기를 초과하면 자원 설명을 임시 데이터베이스 저장소에 저장하고 캐시를 비웁니다.캐시를 더 크게 지정하면 성능은 향상되지만 메모리가 더 많이 사용된다는 단점이 있습니다.

데이터베이스 경로

 

임시 자원 설명 저장 데이터베이스에 사용된 파일

보고서

보고서 부분에서는 검색 서버를 모니터링할 수 있습니다.검색된 사이트, 제외된 URL과 그 이유, 로봇이 방문한 URL에 대한 상세 정보 및 최종 사용자의 관심사 등의 활동 요약을 볼 수 있습니다.

보고서 주제는 다음 하위 주제로 세분됩니다.

시작 위치

로봇은 시작할 때마다 사용 가능한 모든 사이트를 방문합니다.

표 26 시작 위치 보고서 속성

속성

기본값

설명

사용 설정

현재 사이트 값.

예 또는 아니오.

이는 로봇/사이트 페이지에서 설정합니다.

시작 위치

선택된 URL:80

링크는 선택된 URL을 가져옵니다.

사이트 정의 내

선택된 URL

로봇/사이트 편집 페이지로 링크.

깊이

선택된 검색 수준 나열.

로봇/사이트 페이지의 1-n 집합.

제외된 URL

이 페이지에서는 실행되는 로봇의 목록을 보여줍니다. URL이 제외된 이유 목록을 표시하려면 검토할 로봇 실행을 선택하고 [선택된 항목 보기]를 선택한 다음 [제외 이유] 중 하나를 선택합니다.해당 이유에 대해 제외된 URL 목록이 표시됩니다.중복된 경고 제외 항목은 제거됩니다.

표 27 제외된 URL 보고서 속성

속성

기본값

설명

로그

가장 최근 실행의 로그를 나열합니다.

사용 가능한 모든 실행 로그를 나열합니다.

카운트

횟수

제외 이유의 횟수 목록.

제외 이유

사이트가 허용되지 않은 이유 목록.각 이유는 해당 이유로 제외된 모든 URL 목록과 연결됩니다.

URL이 제외된 이유로 필터 규칙, 찾을 수 없는 파일, 허용되지 않는 사이트, 허용되지 않는 프로토콜, 오류, 중복 등이 있습니다.

로봇 고급 보고서

이 페이지에서는 로봇에서 보고된 다수의 서로 다른 보고서에 액세스할 수 있습니다.드롭다운 목록에서 정보를 얻을 보고서를 선택하면 선택 보고서가 나타납니다.새로 고침 버튼으로 최신 정보를 얻습니다.

표 28 로봇 고급 보고서 속성

속성

기본값

설명

고급 로봇 보고서

버전

버전, DNS 캐시 덤프, 성능, 발견 서버-모두, 발견 서버-RDM, 상태-현재 구성, 상태-데이터베이스(내부), 상태-Libnet, 상태-모듈, 상태-개요, URL-추출 준비, URL-인덱싱 준비, URL- 필터링 대기(URL 풀), URL- 인덱싱 대기, 모든 보고서.

로그 파일

이 페이지에서는 로그 파일의 항목이나 특정 라인을 볼 수 있습니다.로그 파일 드롭다운 목록. [보기] 버튼을 선택할 때 표시할 라인 수를 입력합니다.

표 29 로그 파일 보기 보고서 속성

속성

기본값

설명

이 로그 파일 보기

제외된 URL(필터)

제외된 URL(필터), RD 관리자(rdmgr), RDM 서버(rdmsvr), 로봇 활동(로봇), 검색 엔진(searchengine), 사용자 쿼리(rdm).

줄 수

25

로그 파일의 최신 항목을 표시하기 위해 입력할 수 있는 수.

인기 있는 검색

이 페이지에서는 사용자가 검색하는 내용을 볼 수 있습니다.가장 자주 사용하는 검색이 보고서 처음에 표시됩니다.

표 30 인기 있는 검색 보고서 속성

속성

기본값

설명

찾아보기 제외

False (선택 해제)

False(선택 해제)는 사용자가 찾아보는 범주를 포함시킵니다. True(선택)는 찾아보기 통계를 제외시킵니다.

일정

로봇 시작

이 페이지에서는 로봇의 자동 시작 시간을 설정합니다.

표 31 로봇 시작 속성 일정 계획

속성

기본값

설명

시간

00:00

로봇이 검색을 시작하는 시간입니다.

선택 없음

일요일, 월요일, 화요일, 수요일, 목요일, 금요일 또는 토요일

 

로봇 정지

이 페이지에서는 로봇의 자동 중단 시간을 설정합니다.

표 32 로봇 정지 속성 일정 계획

속성

기본값

설명

시간

00:00

로봇을 연속적으로 실행하려는 경우 하루에 한 번은 정지하고 다시 시작하는 것이 좋습니다.그러면 로봇이 자원을 해제하고 다시 초기화할 수 있습니다.

선택 없음

일요일, 월요일, 화요일, 수요일, 목요일, 금요일 또는 토요일

가져오기 시작

이 페이지에서는 에이전트 가져오기를 위한 일정을 설정합니다.

표 33 에이전트 가져오기 속성 시작 일정 계획

속성

기본값

설명

시간

00:00

에이전트 가져오기가 가져오기를 시작하는 시간.

선택 없음

일요일 - 토요일

 

자동 분류 시작

이 페이지에서는 자동 분류 기능의 시작 일정을 설정합니다.

표 34 자동 분류 속성 시작 일정 계획

속성

기본값

설명

시간

00:00

자동 분류를 시작할 시간

선택 없음

일요일 - 토요일

 


목차