class="color-gray post-type-text paging-view-more">
본문 바로가기

webCrawling

(2)
🛰 시간 기록의 기술 — 우주 망원경과 블로그 타임스탬프 허블 망원경은 1990년 지구 궤도에 올랐고,제임스웹 망원경은 2021년 우주의 깊이를 탐색하기 시작했다.두 망원경은 단순한 ‘카메라’가 아니다.우주는 ‘빛의 시간차’로 관측되기 때문에,이들은 시간을 수집하는 ‘기록 장치’다.과거의 별빛을 수년, 수십억 년 늦게 관측하며천문학자들은 시간의 퍼즐을 맞춰왔다.이처럼, 시간을 어떻게 저장하느냐는관찰의 정확성과 인식의 깊이에 직접적인 영향을 준다.블로그도 마찬가지다.⌛ 타임스탬프가 중요해지는 순간블로그 글 하나에도 타임스탬프(time stamp)가 찍힌다.그건 단순한 발행 날짜가 아니라,검색엔진과 독자가 해당 글을 언제, 어떻게 인식하는지를 좌우하는 좌표다. • 예약 발행을 했는가? • 실시간으로 올렸는가? • 글 수정 날짜가 지나치게 오래됐는가?이 모든 요소는..
🌌 크롤링이란, 검색엔진의 천체관측 — 사이트맵과 로봇.txt로 블로그를 우주로 보내기 블로그는 밤하늘과 비슷하다.별이 수없이 떠 있어도,망원경이 그 좌표를 읽지 못하면그 존재는 잊혀진다.검색엔진도 마찬가지다.크롤링이란 건,망원경처럼 인터넷 세계를 관측하는 ‘로봇’의 눈이다.내 블로그 글이 우주에 떠 있는 별처럼 빛나길 원한다면,먼저 ‘관측 가능한 좌표’를 설정해야 한다.그게 바로 사이트맵과 로봇.txt 설정이다.🛰 사이트맵이란?사이트맵은 내 블로그 글들의 전체 지도를 만드는 일이다.“어디에 어떤 글이 있는지 알려줄게”라는 선언문 같은 것.구글 등록 방법 1. 구글 서치 콘솔 접속 → ‘사이트맵’ 클릭 2. 도메인 뒤에 /sitemap.xml 입력 3. ‘제출’ → 성공 메시지 확인네이버 등록 방법 1. 네이버 서치 어드바이저 접속 2. 사이트 등록 후 ‘요청’ → 사이트맵 제출 3. 동..