위드파트너

네이버, 복사문서 판독시스템가동 불펌 블로그 검색제외 본문

마케팅이야기/신규웹서비스

네이버, 복사문서 판독시스템가동 불펌 블로그 검색제외

위드파트너 2007. 8. 15. 21:45

블로그에는 ‘뉴스 펌’이 많은데, 유사도 비교를 통해 퍼간 글에 대한 뉴스 가중치를 부여하고, 뉴스 스크랩은 검색에서 배제하며, 원본 작성자가 상위에 랭크되는 패턴을 마련할 것”이라고 하였습니다.
하지만 지금 과도기적 상황인지는 몰라도 직접 컨텐츠를 작성하고 있는 다수의 블로거들이 네이버 검색에서 하위로 밀려나는 현상을 경험하고 있습니다.
저 또한 비슷한 실정이구요...
제가 블로그에 올리는 글의 90% 이상은 직접 컨텐츠를 작성하는 것인데, 복사문서판독시스템이 적용된 후로 기존 상위에 노출되던 검색결과가 하위로 밀려난 것을 확인할 수 있습니다. (당연히 방문 트래픽도 상당히 줄었지요)
앞으로 점점 개선될것을 기대해봅니다.

사용자 삽입 이미지

1) 복사문서판독시스템이란 무엇인가요?
- 카페, 블로그, 언론사 뉴스 문서의 복사유무와 그 정도를 계산하여, 중복문서는 통합 검색결과에서 제외함으로써 검색 서비스의 품질을 개선하는데 사용하는 시스템

2) 네이버 복사문서판독시스템의 가장 큰 특징은 무엇인가요?
- 기존 시스템과는 달리 하나의 문서를 의미 있는 단락단위로 나누어서 복사유무를 판독하기 때문에, 100% 똑같이 일치하는 문서뿐만 아니라 본문 일부가 중복되는 문서까지 알 수 있다는 점입니다.

- 뉴스 스크랩후 자신의 의견을 적는 형태의 경우 '인용'의 수준을 넘어서는 경우 중복문서로 판단.

3) 동일한 여러 문서가 있을 경우 어떤 문서가 원본으로 판독되나요?
게시물이 최초로 작성된 시간 등을 기준으로 원본 문서를 추정해, 이를 기본적으로 노출하게 됩니다. 중복문서 판독시스템은 원본을 100% 판독할 수 있는 시스템은 아닙니다. 다만, 원본일 확률이 높은 문서를 추정하여 이를 검색에 보여주고 있습니다.

타 포탈사이트에도 비슷한 룰이 적용될 것으로 예상합니다. (이미 적용해나가고 있을 수도 있구요)
네이버는 자사 스팸블로그를 단속하는게 무엇보다 시급한 문제일 것입니다.