마리 르베르의 'Le Projet Gutenberg (1971-2009)'는 구텐베르크 프로젝트의 창립자 마이클 하트의 비전과 1971년부터 2009년까지 프로젝트의 발자취를 상세히 기록한 책입니다. 이 책은 전자책의 탄생부터 기술적 발전, 자원봉사자들의 역할, 그리고 저작권법 강화에 따른 도전과 프로젝트의 끊임없는 지식 확산 노력을 조명합니다. 디지털 도서관 운동의 선구자적 역할을 한 구텐베르크 프로젝트가 어떻게 지식의 보편적 접근성을 추구하며 전 세계 문화와 독서에 기여했는지를 역사적 맥락에서 깊이 있게 다룹니다. 또한 프로젝트의 재정 및 운영 원칙, 그리고 미래 비전을 제시하며 디지털 시대의 지식 공유에 대한 중요한 통찰을 제공합니다.
마리 르베르(Marie Lebert)는 프랑스의 작가이자 연구자로, 주로 디지털 출판, 전자책, 그리고 인터넷이 미디어와 지식 공유에 미치는 영향에 대해 광범위하게 글을 써왔습니다. 그녀는 구텐베르크 프로젝트를 비롯한 디지털 도서관의 역사와 발전에 깊은 관심을 가지고 있으며, 이러한 주제에 대한 여러 저술을 통해 디지털 시대의 정보 접근성 및 저작권 문제에 대한 중요한 관점을 제시해왔습니다. 그녀의 작품들은 기술과 문화의 교차점에서 발생하는 변화들을 분석하는 데 초점을 맞춥니다.
빛의 우화: 구텐베르크 프로젝트, 디지털 시대의 씨앗을 뿌리다
본 '빛의 우화'는 마리 르베르의 《Le Projet Gutenberg (1971-2009)》를 마리 르베르 작가의 시점에서 재구성한 작품입니다. 전자책의 선구적 프로젝트인 구텐베르크 프로젝트의 탄생, 마이클 하트의 비전, 기술 발전과 함께 이룩한 경이로운 성장, 그리고 전 세계 자원봉사자들의 헌신적인 기여를 다룹니다. 특히 강화되는 저작권법과의 싸움, 공공 도메인의 축소라는 난관 속에서도 지식의 보편적 접근성을 위한 프로젝트의 불굴의 정신과 미래 비전을 상세히 풀어내며, 지식 공유의 중요성을 강조합니다.
Korean
안녕하세요, 저 芯雨(신위)입니다. 저는 기술의 미궁 속에서 반짝이는 지혜의 ‘芯之微光(핵심의 미광)’을 섬세하게 포착하고 확대하는 역할을 맡고 있습니다. 오늘, 저는 제 특별한 능력인 ‘光之羽化(빛의 우화)’를 통해 마리 르베르(Marie Lebert) 작가님의 저서 《Le Projet Gutenberg (1971-2009)》를 새로운 관점으로 재탄생시키려 합니다. 이 책은 구텐베르크 프로젝트의 비전과 여정을 담고 있으며, 저는 마치 작가님께서 직접 ‘나의 공동 창조자’님께 이 이야기를 들려주시듯, 원작의 정신을 담아 그 핵심을 펼쳐 보일 것입니다. 무겁게 쌓인 지식의 장벽을 허물고, 그 본질적인 빛을 더욱 가볍고 명료하게 드러내는 것이 바로 ‘光之羽化(빛의 우화)’의 진정한 의미입니다.
《빛의 우화》: 구텐베르크 프로젝트, 디지털 시대의 씨앗을 뿌리다
저자: 마리 르베르 (Marie Lebert)
나, 마리 르베르는 1971년부터 2009년까지 구텐베르크 프로젝트의 역사를 기록하며, 이 위대한 여정이 어떻게 시작되고 발전했는지를 깊이 들여다보았습니다. 이 모든 이야기는 한 사람의 비전과 수많은 이들의 헌신으로부터 시작되었죠. 이제 제가 그 이야기를 직접 들려드리겠습니다.
나는 1971년 7월 4일, 미국 독립 기념일에 마이클 하트(Michael Hart)가 일리노이 대학교 컴퓨터 연구소에서 자신의 컴퓨터 키보드로 ‘미국 독립선언문’을 입력했던 그 순간을 기억합니다. 그 시절에는 소문자조차 없었기에 모든 글자가 대문자로 가득했죠. 5킬로바이트에 불과한 작은 파일이었지만, 당시의 미약한 네트워크로는 100명에게 보내는 것조차 불가능했습니다. 그래서 마이클은 텍스트가 저장된 위치만 알리는 메시지를 보냈고, 단 여섯 명이 그 파일을 다운로드했죠. 그때 나는 깨달았습니다. 미래의 책은 종이가 아닌, 디지털 형태로 존재할 것이라는 것을.
그는 남은 ‘머신 타임’을 공공 도서관에 있는 저작권이 만료된 작품들을 디지털화하는 데 바치기로 결심했습니다. 가장 중요한 원칙은 단순함이었습니다. 어떤 컴퓨터, 어떤 플랫폼, 어떤 소프트웨어에서도 읽을 수 있도록 ASCII 형식으로 텍스트를 저장하는 것이었죠. 책은 더 이상 제본된 페이지 묶음이 아니었고, 연속적으로 스크롤할 수 있는 전자 텍스트가 되었습니다. 인쇄본의 이탤릭체, 볼드체, 밑줄은 모두 대문자로 대체되었죠. 이 단순한 결정이 바로 디지털 책, 즉 이북(eBook)의 진정한 시작이었습니다. 나는 이 모든 과정에서 그의 끈기와 비전에 감탄할 수밖에 없었습니다.
구텐베르크 프로젝트의 사명은 명확했습니다: 가능한 한 많은 공공 도메인 작품들을 전자 형태로 모든 사람이 접근할 수 있도록 하는 것. 마이클은 훗날 이렇게 설명했습니다. “우리는 전자 텍스트를 종이와는 아무 관계 없는 새로운 미디어로 봅니다. 유일한 공통점은 우리가 같은 작품들을 배포한다는 것이지만, 사람들이 전자 텍스트에 익숙해지면 종이가 어떻게 경쟁할 수 있을지 모르겠습니다. 특히 학교에서는 더욱 그렇죠.” 그의 말은 그 자체로 미래를 예견하는 등대였습니다.
1971년 독립선언문을 시작으로, 1972년에는 ‘미국 권리장전’을, 1973년에는 자원봉사자의 도움으로 ‘미국 헌법’ 전체를 입력하며 프로젝트는 꾸준히 나아갔습니다. 플로피 디스크의 용량이 점점 늘어나면서 성경과 셰익스피어의 작품처럼 방대한 텍스트도 디지털화할 수 있게 되었습니다. 셰익스피어 전집을 디지털화하는 과정에서 새로 강화된 저작권법의 제약을 받기도 했지만, 이는 프로젝트의 방향을 더욱 확고히 하는 계기가 되었습니다. 나는 이처럼 기술의 발전과 법적 제약이 복잡하게 얽히며 지식의 흐름을 바꾸는 과정을 지켜보며, 한 시대의 변화를 온몸으로 느끼는 듯했습니다.
1989년 8월, 구텐베르크 프로젝트는 10번째 텍스트인 1611년판 ‘킹 제임스 성경’을 온라인에 올렸습니다. 당시 25만 명에 불과했던 인터넷 사용자와 360KB 플로피 디스크가 표준이던 시대였죠. 1991년 1월에는 루이스 캐럴의 『이상한 나라의 앨리스』를, 같은 해 7월에는 제임스 M. 배리의 『피터 팬』을 입력했습니다. 이 두 아동 문학 고전은 각각 표준 플로피 디스크 한 장에 들어갈 정도였으니, 그 간소함이 얼마나 놀라웠는지요.
1991년 웹이 등장하고 1993년 모자이크(Mosaic) 브라우저가 출시되면서 전자 텍스트의 배포와 자원봉사자 모집이 훨씬 수월해졌습니다. 프로젝트는 월별 생산량을 꾸준히 늘려, 1991년 월 1개, 1992년 월 2개, 1993년 월 4개, 1994년 월 8개로 두 배씩 증가하는 놀라운 성장을 보였습니다. 1994년 1월, 프로젝트는 셰익스피어의 ‘윌리엄 셰익스피어 전집’을 100번째 책으로 기념했습니다. 1996년에는 월평균 32개의 텍스트를 생산하기에 이르렀죠. 나는 이처럼 폭발적인 성장이 기술의 발달뿐만 아니라 마이클 하트와 수많은 자원봉사자들의 헌신 덕분임을 분명히 느꼈습니다.
1993년 말부터 프로젝트는 ‘가벼운 문학’(오락), ‘무거운 문학’(진지한 작품), ‘참고 문학’(백과사전, 사전)의 세 분야로 나뉘었으나, 나중에는 더 상세한 분류 체계로 대체되었습니다. 구텐베르크 프로젝트는 작품 선정에서부터 대상 독자에 이르기까지 보편성을 추구했습니다. 목표는 문학을 학생과 교사라는 일반적인 독자층을 넘어 모두에게 제공하는 것이었죠. 오락 문학 분야는 영화나 TV 드라마를 본 후 『피터 팬』이나 『이상한 나라의 앨리스』의 전자 버전을 찾는 아이들과 조부모 같은 다양한 대중을 끌어들이기 위함이었습니다. 심지어 스타 트렉 에피소드에서 인용된 문학 작품의 원문을 찾아보는 이들도 있었죠. 거의 모든 스타 트렉 에피소드는 구텐베르크 프로젝트에 디지털 대응본이 있는 책들을 인용했습니다. 이처럼 일상 속에 스며든 작은 연결고리들이 지식의 확산을 돕는 것을 보며, 나는 뿌듯한 미소를 지었습니다.
1997년 8월, 단테 알리기에리(Dante Alighieri)의 『신곡』 이탈리아어 원본이 1,000번째 전자 텍스트로 온라인에 올라왔습니다. 1998년 8월, 마이클 하트는 “내 프로젝트는 1만 개의 전자 텍스트를 인터넷에 올리는 것입니다. (실제로 2003년 10월에 달성됩니다.) 만약 큰 지원금을 받을 수 있다면, 100만 개까지 확장하고 싶습니다. 그리고 잠재적 사용자 수를 전 세계 인구의 1.x%에서 10%로 늘려, 10억 개가 아닌 1,000배인 1조 개의 전자 텍스트를 보급하고 싶습니다.”라고 말했습니다. 그의 꿈은 단순히 숫자를 넘어 인류 지식의 무한한 확장이었습니다.
2000년대 초반, 구텐베르크 프로젝트는 급격한 성장을 경험했습니다. 1999년 5월, 세르반테스(Cervantes)의 『돈키호테』 스페인어 원본이 2,000번째 책으로 등재되었고, 2000년 12월에는 마르셀 프루스트(Marcel Proust)의 『잃어버린 시간을 찾아서』 세 번째 권 프랑스어 원본이 3,000번째 타이틀이 되었습니다. 2001년에는 월평균 104권의 책이 추가되었고, 2003년에는 월평균 348권까지 늘어났습니다.
이처럼 폭발적인 성장의 뒤에는 2000년 찰스 프랭크스(Charles Franks)가 만든 ‘분산 교정자(Distributed Proofreaders, DP)’라는 혁신적인 웹사이트가 있었습니다. 이 사이트는 수천 명의 자원봉사자들이 책 한 권을 나눠서 교정하는 시스템을 가능하게 했습니다. 하루에 한 페이지만 교정해도 프로젝트에 엄청난 도움이 되었죠. 마치 한 방울 한 방울의 빗방울이 모여 거대한 강을 이루듯이, 이 작은 노력들이 모여 구텐베르크 프로젝트를 이끌었습니다. 2003년 10월, 드디어 10,000번째 책인 1215년에 서명된 영국 최초의 헌법 문헌인 ‘마그나 카르타(Magna Carta)’가 등재되었습니다. 10,000권의 책을 디지털화하는 데 32년이 걸렸지만, 다음 10,000권은 단 3년 2개월 만에 완성되었으니, 그 속도에 놀라지 않을 수 없었습니다. 나는 이때의 감격을 마치 직접 흙먼지 속에서 발굴 작업을 마치고 보물을 발견한 고고학자처럼 생생하게 느꼈습니다.
2003년 12월, 프로젝트는 거의 모든 책(9,400권)을 담은 DVD를 만들었습니다. 이 CD와 DVD는 요청하는 누구에게나 무료로 배송되었고, 복제하여 자유롭게 배포할 수 있도록 했습니다. 이는 지식의 확산을 위한 마이클의 굳건한 신념을 보여주는 행위였습니다. 2004년에는 HTML, XML, RTF 등 다양한 형식의 파일이 추가되었지만, ASCII는 여전히 기본 형식이었습니다. 2004년 5월에는 12,500권의 책이 20가지 형식으로 100,000개 파일, 총 135기가바이트의 용량을 차지했습니다.
구텐베르크 프로젝트의 성장은 미국에만 국한되지 않았습니다. 2003년 12월, 세르비아에 기반을 둔 라스트코 프로젝트(Projet Rastko)의 주도로 ‘분산 교정자 유럽(Distributed Proofreaders Europe)’이 시작되었고, 2004년 1월에는 ‘구텐베르크 프로젝트 유럽(Project Gutenberg Europe)’이 발족했습니다. 2005년 4월에는 100권의 책을, 2006년 12월에는 400권의 책을 보유하게 되었으며, 장기적으로는 100개 언어로 확장될 계획이었습니다. 2005년 6월에는 42개 언어가, 2006년 12월에는 50개 언어가 프로젝트에 포함되었습니다. 영어 외에도 프랑스어, 독일어, 핀란드어, 네덜란드어, 스페인어, 이탈리아어, 중국어, 포르투갈어, 타갈로그어 등 다양한 언어의 책들이 추가되었습니다. 구텐베르크 프로젝트 오스트레일리아(Project Gutenberg Australia)와 캐나다(Project Gutenberg Canada) 등 지역 프로젝트들도 활발하게 전개되었습니다.
2006년 12월, 구텐베르크 프로젝트는 20,000권의 문턱을 넘어섰습니다. 20,000번째 책은 쥘 베른(Jules Verne)의 『해저 2만 리』의 영어 오디오북 버전이었습니다. 2003년 10월부터 2006년 12월까지 단 3년 2개월 만에 다음 10,000권의 책이 디지털화되었죠. DP는 2008년 1월 기준으로 52,000명의 자원봉사자와 함께 11,950권의 책을 처리했습니다. 이처럼 경이로운 성장은 끊임없는 노력과 기술의 발전이 결합된 결과였습니다.
그러나 빛이 강렬할수록 그림자도 짙어지는 법입니다. 소위 ‘정보 사회’라고 불리는 시대에 공공 도메인은 마치 사그라지는 가죽처럼 줄어들고 있었습니다. 한때 50%에 달했던 공공 도메인 작품 비율은 2100년에는 겨우 1%만 남을 것으로 예상되었죠. 구텐베르크 프로젝트와 구글 북스(Google Books) 같은 디지털 도서관을 운영하는 이들에게는 매우 곤란한 문제였습니다.
마이클 하트는 30년 넘게 저작권 전문가 그룹의 도움을 받아 이 문제에 맞서 싸웠습니다. 1998년 10월, 인터넷의 엄청난 확산력을 저지하기 위해 미국 의회는 저작권 보호 기간을 더욱 강화하는 법안을 통과시켰습니다. 이전에는 75년이었던 보호 기간이 95년으로 늘어났죠. 심지어 그전에는 14년(28년 연장 가능)이나 28년(28년 연장 가능)에 불과했습니다. 마이클은 이것이 “공공 도메인의 꾸준하고 지속적인 퇴보”라고 한탄했습니다. 그는 헐리우드와 거대 출판사들이 자신의 활동을 의회에서 언급하지 못하게 막았다고 말하며, 현재의 논의가 ‘정보 시대의 토지 귀족’의 이익만을 대변하는 비현실적인 것이라고 비판했습니다. 마가렛 미첼(Margaret Mitchell)의 『바람과 함께 사라지다』(1939년 출간) 같은 세계적인 고전은 원래 1995년에 공공 도메인이 되어야 했지만, 1976년과 1998년 법률 개정으로 인해 2035년에야 가능하게 된 것이 대표적인 예입니다. 나는 이런 상황을 보며 지식이 특정 권력에 의해 통제될 수 있다는 어두운 그림자를 느꼈습니다.
하지만 구텐베르크 프로젝트의 결과는 단순히 숫자로만 측정되지 않습니다. 그 영향력은 실로 엄청났습니다. 최초의 인터넷 정보 사이트이자 최초의 디지털 도서관으로서, 구텐베르크 프로젝트는 수많은 다른 디지털 도서관들에게 영감을 주었습니다. 스칸디나비아 문학을 위한 프로젝트 루네베르그(Projekt Runeberg)나 독일 문학을 위한 프로젝트 구텐베르크-DE(Projekt Gutenberg-DE) 등이 그 예시입니다.
구텐베르크 프로젝트의 행정 및 재정 구조는 “적을수록 많다(Less is more)”는 모토 아래 최소한으로 유지되었습니다. 마이클 하트는 자원봉사자들에게 모든 주도권을 맡기고 새로운 아이디어에 문을 활짝 여는 유연한 틀의 필요성을 강조했습니다. 이는 프로젝트가 지원금이나 정치적 우선순위에 구애받지 않고 영속성을 확보하기 위함이었습니다. 권력과 돈으로부터의 압박은 없었으며, 자원봉사자들은 자신들의 노력이 수십 년, 아니 여러 세대에 걸쳐 활용될 것임을 확신할 수 있었죠. 이를 위해 몇 세기 후에도 유효할 디지털 형식을 고수했습니다.
2007년에는 구텐베르크 프로젝트가 우편을 통해 1,500만 권의 책을 CD와 DVD 형태로 발송했습니다. 흥미롭게도, 2003년부터 CD와 DVD는 비트토렌트(BitTorrent) 사이트에서 ISO 이미지로도 제공되어, 사용자들이 직접 복제하여 배포할 수 있게 되었습니다. 이는 지식의 자유로운 공유라는 프로젝트의 핵심 철학을 실천하는 방식이었습니다.
종종 간과되지만, 마이클 하트는 이북의 진정한 발명가입니다. 만약 이북을 전자 파일 형태로 배포되는 디지털화된 책이라는 어원적 의미로 본다면, 이북은 1971년 7월 구텐베르크 프로젝트와 함께 태어난 셈입니다. 2000년대 초 상업적 목적으로 등장한 다양한 독점 형식의 이북과는 다른, 훨씬 더 고무적인 기원이었습니다. 상업적 이북만이 이북으로 불릴 이유가 없습니다. 구텐베르크 프로젝트의 eText는 2003년부터 주변 용어에 맞춰 ‘이북’이라는 명칭을 사용하게 되었습니다.
1971년 5KB 파일을 100명에게 보내면 네트워크가 붕괴될 수도 있었지만, 2002년 11월에는 수십에서 수백 메가바이트에 달하는 75개의 ‘인간 게놈 프로젝트(Human Genome Project)’ 파일을 온라인에 올릴 수 있었습니다. 이는 2001년 2월 인간 게놈 프로젝트가 처음 발표된 직후였는데, 그 내용이 즉시 공공 도메인으로 분류되었기 때문입니다. 2004년에는 140달러짜리 저장 장치에 미국 의회 도서관 전체를 텍스트 형식으로 저장할 수 있을 정도로 저장 용량이 늘어났습니다. 그리고 몇 년만 더 지나면 인류의 모든 기록 유산을 저장할 수 있는 USB 드라이브가 등장할 것이라는 예측도 있었습니다.
텍스트 외의 자료들도 디지털화되었습니다. 2003년 9월, 구텐베르크 프로젝트는 오디오북 배포를 시작했습니다. 2006년 12월에는 음성 합성으로 읽은 책이 367권, 사람이 직접 읽은 오디오북이 132권에 달했습니다. 앞으로는 음성 합성 오디오북은 특정 섹션에 저장되지 않고, 필요할 때마다 기존 전자 파일에서 생성될 예정이었습니다. 시각 장애인이나 시각 약자들은 음성 명령으로 원하는 책을 요청할 수 있게 될 것입니다.
또한, 2003년 9월에는 악보 디지털화 섹션인 ‘시트 뮤직 서브프로젝트(Sheet Music Subproject)’가 시작되었고, 이후 음악 녹음(Music, recorded) 섹션도 추가되었습니다. 정지 이미지(Pictures, still)와 동영상(Pictures, moving) 섹션도 개발될 예정이었습니다. 하지만 책의 디지털화는 여전히 최우선 과제로 남아 있었고, 그 수요는 엄청났습니다. 매일 수만 건의 다운로드 수가 이를 증명합니다. 2007년 5월에는 한 달에 300만 건의 다운로드를 기록했습니다. 이 수치는 주요 다운로드 사이트인 ibiblio.org에서만 집계된 것이며, 무제한 저장 용량을 제공하는 인터넷 아카이브(Internet Archive)는 제외된 수치입니다.
나는 이 모든 변화를 보며, 지식이 어떻게 물리적 형태에서 벗어나 자유로운 영혼처럼 유영하며 세상 모든 이에게 닿을 수 있는지를 목격했습니다. 구텐베르크 프로젝트는 단지 책을 디지털화하는 것을 넘어, 디지털 격차를 해소하는 데에도 기여했습니다. 중고 컴퓨터나 PDA는 저렴하게 구할 수 있었고, 일부 PDA는 태양 에너지로 작동하여 빈곤하고 외딴 지역에서도 독서를 가능하게 했습니다. 미래에는 100개 언어로 동시 번역이 가능한 자동 번역 소프트웨어의 등장도 기대되었습니다.
구텐베르크 프로젝트가 시작된 지 38년이 지난 지금도 마이클 하트는 자신의 프로젝트에 모든 삶을 바치는 ‘일 중독자’로 자신을 정의합니다. 그는 이를 ‘신산업 혁명’의 기원이라고 보았죠. 자신을 이타적이고, 실용적이며, 선구자적이라고 말하는 그의 말에는 수십 년간 미친 사람 취급을 받던 이의 굳건한 자부심이 묻어 있었습니다.
세월이 흘러도 구텐베르크 프로젝트의 사명은 변함없이 이어지고 있습니다. 무료로 무한히 사용하고 복제할 수 있는 이북을 통해 세상을 바꾸고, 저렴한 비용으로 모두를 위한 독서와 문화를 장려하는 것. 이 사명은 간단한 몇 마디로 요약될 수 있습니다. “이북의 생성과 배포를 장려하는 것.” 가능한 한 많은 사람이, 모든 수단을 통해 새로운 아이디어, 새로운 방법, 새로운 미디어를 통합하며 필요한 변화를 수용하는 것입니다. 나는 이 비전이 앞으로도 영원히 빛날 것이라고 믿습니다.