안녕하세요, 생각하는 고양이입니다. 이번에는 웹사이트 운영자들이나 블로거에게 유용할 정보를 가져왔어요. 바로 검색로봇이 웹 페이지를 어떻게 방문하는지, 그리고 그 중에서도 네이버 검색로봇 Yeti를 어떻게 확인하는지에 대해 이야기하려고 해요.

검색로봇이란 무엇인가?
먼저, 검색로봇이란 검색 엔진이 웹 페이지를 수집하고 색인화하기 위해 보내는 소프트웨어 프로그램입니다. 이것은 자동으로 웹 사이트를 방문하여 웹 페이지의 내용을 읽어들이고, 검색 엔진 데이터베이스에 저장해 둡니다.
User-Agent: 검색로봇의 신분증
웹 서버에 접근할 때마다 이 검색로봇은 'User-Agent'라는 것을 사용하여 자신을 식별합니다. 이것은 마치 신분증을 보여주는 것과 같아요. 예를 들어, 네이버의 검색로봇은 User-Agent에 'Yeti'라고 명시되어 있습니다.
Mozilla/5.0 (compatible; Yeti/1.1; +https://naver.me/spd)
웹사이트 운영자라면 이 정보를 통해 네이버 검색로봇이 사이트에 접근하는 것을 허용하거나 차단할 수 있죠.
IP로 검색로봇 확인하기
그런데 User-Agent 정보는 변조될 수 있기 때문에, 이를 보완하기 위해 '역 DNS 조회' 방법을 사용할 수 있습니다. 이는 접근한 IP 주소가 실제로 네이버 검색로봇인지 확인하는 방법입니다.
- 리눅스 환경에서의 예시
$ host 125.209.235.169 169.235.209.125.in-addr.arpa domain name pointer crawl.125-209-235-169.web.naver.com. $ host crawl.125-209-235-169.web.naver.com crawl.125-209-235-169.web.naver.com has address 125.209.235.169
- 윈도우 환경에서의 예시
C:\Users> nslookup 125.209.235.169 Server: cns1.naver.com Address: 10.22.64.6 Name: crawl.125-209-235-169.web.naver.com Address: 125.209.235.169
이렇게 해서 확인된 IP 주소와 도메인 이름이 일치한다면, 그것은 실제 네이버 검색로봇입니다.
정리
웹사이트나 블로그를 운영하는 사람들에게 검색로봇은 중요한 존재입니다. 검색로봇을 잘 활용하면 사이트의 가시성을 높일 수 있으니, 검색로봇이 어떻게 동작하는지, 그리고 어떻게 검증하는지 알아두는 것이 좋겠죠. 네이버 검색로봇 Yeti를 예로 들어 설명했지만, 다른 검색 엔진의 로봇도 비슷한 방식으로 동작합니다.
이상, 생각하는 고양이였습니다. 다음에 또 유용한 정보로 찾아뵐게요!
'생산성' 카테고리의 다른 글
SPA와 자바스크립트를 네이버 검색에 최적화하는 방법 (0) | 2023.09.06 |
---|---|
HTTP 규약과 응답코드의 이해 (0) | 2023.09.05 |
웹사이트 종료 전 꼭 알아두어야 할 지침: 안전하고 윤리적인 방법으로 사이트를 마감하자 (0) | 2023.09.03 |
웹 사이트 이전: 고려해야 할 주요 요소와 단계별 가이드라인 (0) | 2023.09.02 |
웹 페이지 이동과 리다이렉트: SEO 최적화와 트래픽 관리를 위한 가이드 (0) | 2023.09.01 |