본문 바로가기

2014_2019/밑줄긋기

[검색, 사전을 삼키다] 그 다음은 어떻게 될까?




이태 전 추석 연휴 마지막 날 출근해 점심을 먹을 때 빠르게 바뀌고 있는 우리 장례 문화가 화제가 된 적이 있다. 한 선배가 “내가 신문사 들어오고 얼마 안됐을 때 매장 문화가 바뀌지 않으면 몇십년 뒤 전국이 산소로 변할 것이라는 기획기사를 쓴 적이 있는데 그런 우려가 무색할 정도로 빠르게 화장문화로 바뀌었다”고 말했다. 실제로 각 민족의 문화에서 가장 느리게 바뀌는 것 가운데 하나가 장례문화라고 하는데 한세대 안에 장례문화가 급속하게 바뀌는 것은 놀라운 일이다.


어디 장례문화뿐이랴. 인터넷과 디지털의 등장은 수십, 수백년 간 존재하던 것들의 모습을 재빠르게 변화시키고 있다. 자가용마다 뒷자석 한자리를 차지하던 ‘운전용 도로교통지도’는 사라진지 오래이며, ‘종이사전’은 아직 서점에서 한 코너를 차지하고 있지만 가쁜 숨을 몰아쉬고 있다. 이제 지도와 사전은 컴퓨터로, 휴대전화로 언제 어디서든 찾아볼 수 있는 물건이 됐다. 그런데 종이로, 책으로 묶여 있던 사전이 단순히 인터넷이라는 매체로 모습을 바꾼 것에 불과할까? 아니기 때문에 이 책이 나왔을 것이다.


사무엘 존슨(Samuel Johnson)은 1755년 [영어 사전(A Dictionary of the English Language)]을 펴내 근대적인 어학 사전의 개념이 확립되는데 지대한 영향을 미친 인물이다. 그는 자신이 펴낸 [영어 사전]에서 ‘사전편찬자’(lexicographer)를 ‘사전의 작가, 무해하고 틀에 박힌 지겨운 일을 하는 사람’이라고 정의했다. 여러 사람이 틀에 박힌 지겨운 일을 해야 사전 한권이 나올 수 있다.


[검색, 사전을 삼키다]의 저자는 사전을 이렇게 정의한다.


사전은 ‘지식에 대한 지식’을 정리한 책이다. 좀 더 엄밀히 말하자면 지식에 대한 개념을 서술한 책이다. (54쪽)


용어 정의는 건조해야 한다. 더 이상 뺄 단어가 없을 때까지, 더 이상 추가할 단어가 없을 때까지 고민해서 정의를 내려야 한다. 그렇게 건조시킨 용어는 하나의 벽돌이 된다. 이 벽돌을 어떻게 쌓아서 지식과 학문으로 만드느냐는 그 다음 단계다. 일단 벽돌 자체가 견고해야 하며, 이를 위해서는 분석과 건조화라는 두 과정을 지속적으로 거쳐야 한다. (55쪽)



백과사전이든, 어학사전이든, 온라인에 자리잡은 위키백과이든 사전 편찬자 혹은 편집자는 수집벽, 정리벽이 남달라야 한다. 그래야 지독히도 틀에 박힌 지겨운 일을 괴롭게 느끼지 않고 해낼 수 있을 것이다. [배를 엮다]라는 소설이나 [행복한 사전]이라는 영화는 말로만 스토리를 전해 들은 것이 있는데 기회 되면 찾아봐야 겠다. 이 이야기를 해준 사람도 부러움 섞인 감정으로 이야기를 했는데 취미로 시작한 수집·정리가 직업으로까지 발전한 저자 역시 마찬가지 감정을 내비친다.


2014년 사전 편찬자의 일생을 다룬 영화 [행복한 사전]이 개봉해서 소소한 호응을 얻었다. 오다기리 조(小田切讓)와 마츠다 류헤이(松田龍平)라는 인기 남자 배우들이 주연을 맡은 영화였지만, 한국에서의 성적은 중간 정도였던 것 같다. 이 영화의 원작 소설인 [배를 엮다(舟を編む)](2011) 역시 국내에 번역 출간되었다. 소재가 소재이니만큼 번역되자마자 사서 읽었는데, 나에게 흥미로웠던 것은 어떻게 이런 소설이 베스트셀러가 될 수 있을까 싶은 일본의 문화였다. (73쪽)



종이사전은 인터넷이 등장하면서 정체기를 맞게 있다. 우리의 사정이 훨씬 심하지만 영어권이나 다른 언어권도 처한 환경은 비슷할 것이다. 또한 컴퓨터의 발달이 사전 편찬 과정에 큰 변화를 끼친 것도 사실이다. 지금도 사전 편찬자의 축적된 지식이 사전 편찬에 지대한 영향을 미치겠지만 ‘감’에 크게 의존하던 전통적인 방식에 비해 컴퓨터의 도움을 받아 실증적으로 작업할 수 있게 된 것이다.


말뭉치 언어학의 발전은 컴퓨터 성능의 발전에 의존한다. 1961년 ‘브라운 말뭉치(Brown Corpus)’가 만들어졌을 때는 100만 어절 규모였고, 책으로 출간이 가능한 수준이었다.…이제 누구도 말뭉치를 인쇄할 생각은 하지 않는다. 지금은 사실상 구글이 색인한 인터넷의 모든 페이지가 일종의 말뭉치 역할을 하고 있다. 언어의 샘플을 다루는 수준이 아니라 언어 자체를 다루는 수준으로 가고 있다.

또 하나 사전에 큰 영향을 주고 있는 것은 집단지성이다. 인터넷 발달 이후 여러 사람이 하나의 문서를 공동으로 작업할 수 있는 ‘위키위키’를 기반으로 한 ‘위키백과(Wikipedia)’가 등장했다. 위키백과는 폭발적으로 성장하여 영어 위키백과는 이미 500만 표제어를 넘어섰다. (82~83쪽)



인터넷의 현재와 미래를 이야기할 때 빠지지 않는 구글이 이번에도 등장한다. [빅데이터 인문학(Uncharted)]이 소개한 구글의 엔그램 뷰어 이야기다. [빅데이터 인문학]을 보면 엔그램 뷰어로 사전에 등재된 단어들의 ‘자격’을 점검해보는 대목이 나온다. 사전에 ‘신생어’가 얼마나 시의 적절하게 반영되는지에 대한 것이었다. 결과는 영 신통치 못한 것으로 나왔다. 컴퓨터의 도움을 받으면 이런 격차가 줄어들 것으로 기대할 수 있을 것이다.



명성은 언급 빈도로도 알아볼 수 있다. 명성이라는 말 자체가 이름이 언급된다는 의미다. 구글 엔그램 뷰어(Google Ngram Viewer)는 디지털화한 수백만 권의 책에서 특정 단어의 사용 빈도를 살펴볼 수 있는 프로그램이다. 즉 특정 인물이 책에서 얼마나 많이 언급되었는가를 측정할 수 있다. 이것을 이용하면 히틀러가 처칠이나 스탈린에 비해 얼마나 많이 언급되었는지 비교가 가능하다. 이를 절대적으로 믿을 필요는 없지만, 적어도 무엇을 먼저 살펴볼 것인가를 정할 때 유의미한 자료로 삼을 수 있을 것이다. (155쪽)



스스로 수집광, 정리광임을 인정하는 저자는 일찌감치 인터넷 서비스 회사에 자리를 잡고 검색과 사전을 기획하는 일을 하고 있다. 그런데 저자는 지금의 상태가 계속될 때 초래될 위험을 강조한다. 일상에서 인터넷으로 키워드를 검색하고 사전을 활용하는 것은 좋은데 그렇다고 ‘진지하게’ 사전을 만드는 일을 게을리 한다면-이미 상당히 게을러져 있는 상태다-지식의 밑동이 허약해질 수 밖에 없다는 것이다. 특히나 사전 만들기 역시 고도의 지식과 기술을 필요로 하는 작업이기 때문에 이 일을 하는 사람이 점점 줄어들면 언젠가는 사전을 만드는 법을 잃어버리게 될지도 모른다.


그렇다면 어떻게 할 것인가? 저자는 국가의 공적인 책임을 강조한다. 충분히 명분이 있는 주장이다. 국가가 게임산업을 육성한다고 수십억, 수백억씩 정책자금을 풀어온 마당에 전국민적 공공재인 사전을 만들기 위한 기본적 인프라를 구축하는데 적극 나서야 한다.


그런데 국가만 나서면 그것으로 족한가? 저자는 네이버를 거쳐 현재는 다음에서 근무하고 있다는데 나는 거대 포털이 할 수 있는 일들도 무궁무진하다고 생각한다. 사용자들의 검색 기록, 사용자들이 스스로 올리는 컨텐츠를 요구하는 연구자들은 아마도 지금도 무척 많을 것이다. 그런데 네이버와 다음은 이들에게 얼마나 문호를 개방하고 있는지 스스로 질문해야 할 것이다.


어학사전에는 더 중요한 일이 남아 있다. 정규화된 말뭉치를 계속 만들어나가야 이후 어떤 사전이든 쓸 만한 것을 만들 수 있다. 좋은 말뭉치 없이 좋은 사전을 만들기란 21세기에는 불가능한 일이다. 그런데도 여전히 한국어 말뭉치는 믿고 사용할 만한 것이 없다. 이는 말뭉치라는 사회저 인프라를 개별 작업자들이 따로 만들기 때문이다. 한국어세계화재단이 진행했던 21세기 세종 계획 말뭉치, 연세대학교 말뭉치, 고려대학교 말뭉치가 있지만 모두 각자 따로 진행한다. 즉 규모의 경제 효과가 나타나지 않는다. 왜 함께 만들어질 수 없는지 그 이유를 모르는 것은 아니지만, 그 어떤 이유도 대규모 말뭉치가 만들어져야 한다는 당위를 깨지는 못한다. 현재 상황에서는 국가가 말뭉치를 만드는 수밖에 없다. 그리고 그것을 전면 개방하여 개인이나 대학이 그에 기초해 사전 작업을 진행할 수 있게 해야 한다. (234~235쪽)



검색, 사전을 삼키다 - 10점
정철 지음/사계절