500년 간 인류가 많이 사용한 단어는?
김재현 기자 kjh10511@chosun.com
기사입력 2010.12.20 10:04

구글북스, 책 1500만여 권 데이터 디지털화

  • 지난 500년 간 인류는 시대에 따라 어떤 단어를 주로 사용했을까?

    구글의 서적 검색 서비스 ‘구글북스’는 16일(현지 시각) 미국 하버드대·매사추세츠공과대(MIT)와 공동으로 논문 ‘컬처러믹스(cultureomics)’를 미국 과학 학술지 ‘사이언스’에 발표했다. 컬처러믹스란 방대한 서적 데이터베이스(DB)를 활용해 인류의 언어 사용 흔적을 추적한 자료. 구글 북스를 통해 누구나 열람할 수 있다.

    이 DB는 시대별로 자주 쓰인 단어와 그렇지 않은 단어를 비교해 보여준다. 예를 들어 ‘남성(men)’과 ‘여성(women)’의 경우, 19세기 중반엔 남성이 여성보다 9배나 많이 등장했지만 1985년엔 두 단어가 비슷하게 쓰였다. 여성의 지위가 높아진 2000년대 이후엔 여성의 사용 빈도가 남성을 넘어섰다.

    구글북스 연구팀은 컬처러믹스 자료를 위해 1500년대부터 지금까지 출판된 서적 1500만여 권을 디지털화(化)했다. 이 중 약 520만권을 다시 추려내 단어 5000억 개를 별도의 DB로 만들었다. 이 작업엔 영어·독일어·불어·스페인어·한자·러시아어·히브리어 등 7개 언어가 포함됐다. 연구에 참여한 에레즈 리버먼 에이든 하버드대 연구원은 “여덟 살짜리 어린이도 책 속 단어의 기록을 통해 역사 속 트렌드(trend·유행) 변화를 이해할 수 있도록 하는 게 이번 작업의 목표”라고 말했다.