네이버 뉴스검색 RSS 위젯을 만들어보겠다고 글을 쓴 것이 2월 27일이었으니 포투블로그에 위젯이 매달린 지 70여일이 지났다. 처음에 위젯을 만들어 블로그에 매달겠다는 결심의 이유는 블로그 디자인을 위한 것이었다. 물론 위젯을 방문자들에게 내 보이고 싶은 욕심도 있었다. 한마디로 폼이 나겠으니까 만들어 본 것이다.
지금 포투블로그에 네이버뉴스 검색위젯은 세 개가 달려있다. 본문 아래에 태그를 입력하면 자동으로 네이버뉴스검색결과를 보여주는 위젯이 하나이고, 사이드바에 IT관련 복수의 키워드를 OR조건으로 네이버 뉴스검색한 결과를 보여주는 위젯이 둘이며, 블로그 하단에 경제관련 복수 키워드를 뉴스검색한 위젯이 셋이다. 뉴스검색을 하기 위한 키워드는 10여 개가 넘는다. 어제는 구글US 뉴스검색RSS위젯도 달았다. 처음 세 줄은 경제관련뉴스이고, 다음 세줄은 IT관련뉴스다.
얼마 전에 글을 쓰면서 영어로 제목을 만든 적이 있었다. 그 시도는 예기치 못한 결과를 만들어냈는데, 국내 방문자들이 줄어든 반면에 해외에서 유입되는 방문자가 늘었다는 사실이다. 방문자들이 들어오는 시간도 달라서 주로 미국에서 방문하는 사람들은 새벽시간에 방문자수를 늘리고 있다. 영어로 검색해서 유입되는 것인지, 미국교포들이 한글을 검색해서 유입되는 지는 확인할 바 없다. Live.com이 유입검색어를 막아놓고 있기에 알 수가 없다.
어쨋든, 구글US 뉴스검색RSS 위젯은 영어로 되어 있다. 구글이 뉴스검색RSS 서비스를 해 주기에 가능한 일이다. 뉴욕타임스나 워싱턴포스트 뉴스를 끌어올까 하는 생각도 있었지만 하나의 신문사 뉴스는 읽을 만한 뉴스가 적을 것이란 생각에 구글US에서 뉴스검색한 결과를 끌어오는 것이 낫다 싶었다. 참고로 구글뉴스는 하루(Last day)내에 발행된 뉴스로 검색조건을 잡아놨다.
구글에서 검색뉴스를 가져오면서 네이버와의 차이도 발견되는데 구글은 최근뉴스검색 기본조건이 한 달 내(Past month)이고 선택조건(Past week, Last day, Last hour)이 다양화되어 있다는 것이다. 물론 더 지난 뉴스도 찾아볼 수 있게 더 세부적으로 나누어 놓았다. 반면 네이버는 두 가지 조건 만이 있다. 정확도와 최신순이 그것이다. 구글은 하루 내 뉴스검색도 최신순이 아니라 정확도를 가려내 보여주고 있다. 그 나마 가장 최신 뉴스를 검색하고 싶으면 한 시간 내로 검색해야 하지만 이 역시도 하루 내에 발행된 뉴스 중에서 정확도를 가려내 보여주고 있다. 구글의 검색엔진 자신감이 느껴지는 대목이다. 한 편으로는 국내뉴스는 일일히 정확도를 가릴만큼 뉴스의 양이 많지 않다는 것이 이유일 수도 있겠다. 미국에서는 뉴스가 넘쳐나서 최신순으로 보여주다가는 메이저, 마이너 가릴 것없이 보여지게 되니 제공되는 뉴스의 질이 떨어지는 것은 아니겠는가 하는 생각이다. 또, 구글은 RSS 뉴스를 10개로 제한하고 있고, 네이버는 20개로 제한하고 있다. 이는 역시 미국에서는 포투와 같이 뉴스 RSS를 이용한 사이트들이 많아 트래픽을 감당할 수 없기에 뉴스 끌어가기를 제한하는 것이 아닐까 하는 생각이다.
RSS 형식은 똑같아야 하는데 네이버와 구글이 좀 다른 면도 있다. 그래서 네이버 뉴스를 잘 끌어오는 위젯이 왜 구글 뉴스 RSS에 먹통이 된나를 찾아보는 데 시간이 좀 걸렸다. 먹통이유는 <author>...</author>에 있었다. 구글 뉴스 RSS에서는 <author>PC World</author>라고 알려주지 않고 제목 끄트머리에다 뉴스 저작권자를 적고 있다. RSS를 제공하겠다는 것이 남들로 하여 쉽게 가져다 보고 가공하게 하여 컨텐츠를 널리 알리기 위함이라고 본다면 형식이 통일되어야 하지 않겠나 하는 생각이다. 어쨋든 똑같은 RSS위젯으로는 똑같은 뉴스정렬이 되지 않는다.
또, 뉴스검색 키워드를 정하려다 보니 많은 키워드를 구글US에 입력해 봤는데 'Bill Gates'로 검색하면 Bill과 Gates 사이의 공백은 AND조건으로 인식하고 있다. 이는 네이버 뉴스검색도 마찬가지다. 그래서 본문아래에 태그를 적으면서 공백을 두고 두 단어를 적었다간 네이버뉴스검색이 되지 않아 위젯란이 공백인 상태로 보여지곤 한다. 최근에 태그의 길이가 좀 길어도 공백을 두지 않고 이어씀은 그 이유다. 네이버는 빌게이츠라 검색을 하면 '빌게'나 '이츠'도 검색하려고 달려든다. 사이드바에 '마이크론' 키워드로 뉴스검색하라 정해 두었더니 어제 오늘 LG마이크론 뉴스를 쏟아내고 있기도 하다. 영어가 대문자와 소문자가 있어 편리하기도 한데 'BillGates'라고 붙여 적으면 인물을 한정하는 효과가 있기도 하다. 뉴스검색을 하다보니 많은 검색알고리즘 개발자들이 고민했던 흔적을 찾을 수 있다. 구글이 우리나라에서 힘들어하는 이유가 한글이 영어와 다른 언어특성에도 기인한다는 생각이 좀 들기도 한다. 위젯을 매만지며, 구글이 가진 검색에서의 장점을 많이 발견한 요즘이다.
위젯을 매달겠다는 것이 처음에는 남을 위한 것이었다면, 지금은 포투 자신을 위해 위젯을 매만지고 있다. 가끔 포투블로그에 들어가 보면서, 많은 언론사 사이트에 들어가 뉴스를 봤는데도, 보지못했던 뉴스가 위젯에 떡하니 올라 있는 경우가 많아진 것이다. 그래서 뉴스검색키워드도 좀 더 점검했다. 이제 구글 US가 제공하는 영어뉴스도 가끔 들여다 볼 참이다.