과거 신문 디지털화와 뉴스유통 전망 : 연배흠 서울시스템 전무
과거 신문 기사 디지털화 현황, 과거 기사 디지털화의 필요성, 과거 기사 단계별 서비스 목표 및 유형, 현재 지면서비스 활용 사례, 향후 발전 방향 순으로 발표를 하도록 하겠습니다. 과거기사 디지털화 구축 현황을 보시면, 지역신문발전위원회서 지역신문발전기금을 통해 지방신문사를 대상으로 2010년부터 현재까지 연간 8~10억정도 예산으로 10~18개사까지 진행을 하고 있습니다. 장기간 투자가 이뤄져서 신문사 창간시기, 발행부수에 따라 서로 상이하나 이미 디지털화를 완료한 곳이 있을 정도로 많은 부분이 디지털로 처리가 되었습니다. 그러다 중앙일간지도 지역신문처럼 디지털화가 필요하다는 의견이 있었구요. 작년 2016년 신문발전기금을 통해 과거신문 디지털화 사업을 추진하게 되었고, 3개사(한국일보, 한국경제, 서울경제) 기준으로 2~3년치 신문의 디지털화 완료했습니다. 2017년에는 10억이란 예산 증액 통해 9개 언론사에 지원될 예정입니다. 7년전 쯤 네이버를 통해 4개사(동아일보,경향신문,한겨레,매일경제) 과거기사 디지털화를 완료했는데 약 300억원이 지원된 것으로 알고 있습니다. 사업결과를 보면 크게 만족스럽지 못하다는 평가입니다. 서비스 형태를 본다면 네이버를 통한 서비스는 플래시 기반의 Viewer이므로 PC에서만 가능하며, 모바일에서는 어려운 구조로 되어있습니다. 비플라이소프트, 다하미를 통해 B2B, B2C 지면 서비스를 하고 있으나, 1990년 이전 자료는 없는 상황이며, 언론사 각사별로 일부 자체 서비스를 하고 있으나 수익 발생은 미미한 상태라고 이해하시면 되겠습니다. 왜 과거신문의 디지털화가 필요할까요. 1940년대쯤 창간되어, 창간 70년 기념행사를 하는 신문사도 꽤 있는데요, 대개 물리적으로 만지면 바스러질 정도이기도 하며, 과거신문에 대해 중요성에 대해 인지를 하지 못하기도 합니다. 실제 신문 수집을 위해 해당 신문사를 방문하면 윤전실, 지하실 등 좋은 환경에서 보관하지 못하고 있으며, 조사자료실에 장소의 문제나 방대한 수량 때문에 보관에 한계성이 있습니다. 물론 보관환경이 아주 잘 된 된 언론사가 있기도 합니다. 어떤 곳은 국가기록원에서 특수처리를 받아서 문서가 오래 보관되는 구조로 바뀌는데, 약간 누런색을 띌 뿐이지 최근 신문처럼 보관상태를 좋게 만들기도 합니다.
과거신문의 물리적인 문제점으로 서둘러 디지털화가 필요해..더불어 독자 서비스의 기대치가 점점 높아지고 있다는 점.. 과거기사를 활용해서 손쉽게 부가가치 높은 콘텐츠 제작시 인력과 시간이 소요되는데, 그보다 먼저 디지털화가 선행해야 하기 때문이기도 함.. 이런 환경속에서 구조화된 형태로 과거기사가 데이터베이스로 구축되어야 있어야 인포그래픽이든, 새로운 콘텐츠를 제작을 할 수고, 콘텐츠 유료화에 대한 시도가 가능. 이처럼 과거신문의 물리적인 문제점으로 서둘러 디지털화가 필요합니다. 더불어 독자들의 서비스의 기대치가 점점 높아지고 있다는 점입니다. 과거기사를 활용해서 손쉽게 부가가치 높은 콘텐츠 제작시 많은 인력과 시간이 소요되는데, 먼저 디지털화를 선행해야 하기 때문이기도 합니다. 예전과 달리 언론사내 조사부의 인력구조는 줄어드는데 반해 요구사항은 점점 많아지고 있기때문에, 이런 환경속에서 구조화된 형태로 과거기사가 데이터베이스로 구축되어야 있어야 인포그래픽이든, 새로운 콘텐츠를 제작을 할 수 있습니다. 마지막으로 무엇보다도 콘텐츠 유료화에 대한 필요성 인식 때문이기도 합니다.
현재 과거기사 디지털화에 있어서 예전보다 기사 콘텐츠 관리 기술이 발달했습니다. 데이터베이스 연계 기술이나 기사 콘텐츠 대표 키워드 추출 기술, 자동분류, 개체명(인물,기관단체,지명 등) 인식 및 식별 기술은 좋아져서 과거기사의 콘텐츠화에 수작업이 많이 들지만, 100%까지는 아니지만 많이 자동화되어있습니다. 이러한 기술이 필요한 이유는 정형화되어있는 기사가 있어야 아이디어를 통해 다양한 콘텐츠를 생산할 수 있기 때문입니다. 과거기사 단계별 서비스 목표 및 유형입니다. 제가 말씀드리고 싶은 것은 과거신문 디지털화가 신문사별 예산규모와 디지털화로 무엇까지 할 것인지 감안한 단계별 처리 방안 설정이 중요하다는 것입니다. 1단계는 종이신문 스캔후 PDF 생성을 통한 과거자료 최적 상태 확보 작업입니다. 스캔만 한다면 면당 1천원 정도 아주 저렴한 예산으로 할 수 있습니다. 2단계는 신문 기사 및 기본적인 신문만보고 알수 있는 메타정보(날짜,면,기사제목, 기자명,분류)만 입력하는 단계입니다. 3단계는 지면 블록별 서비스를 위한 이미지 크롭까지 하는 단계입니다. 과거에는 이미지 PDF로 넘겨셔 신문을 보는 것이 보편화되었다면, 지금은 독자가 필요한 부분만 검색해 지면 블록별 스크랩을 해서 사용하는 방식이 늘어나고 있습니다. 몇 개 신문사 매일경제, 아시아경제, 중앙일보 등이 서비스하고 있는데, 가판서비스 좌표 블록을 지정한 형태로 가편서비스를 유료화해서 상당한 이익을 벌고 있습니다. 4단계는 과거신문에도 이미지 크롭을 생성하고, 자동화툴을 활용해 추가적 메타정보를 입력하는 단계입니다. 추가 메타정보가 여러가지가 있지만, 인물, 기관단체, 기업, 장르, 지역, 키워드, 요약정보, 감성정보 등이 입력이 된다면 향후에 더 높은 부가가치가 생길수 있겠죠. 서두에 말씀드렸지만, 이러한 단계를 결정하는 부분은 아주 중요합니다. 4단계까지 선택했을 때 작업 기간과 비용이 추론이 될 수 있는데, 많은 기간과 비용이 투여되어야 합니다. 가용예산과 신문의 상태 등을 판단해서 어떻게 단계별로 진행해야 하는지 고려해서 진행해야 합니다.
과거기사 단계별 서비스 유형은 단계별 산출물을 활용하여 서비스를 위한 전용 Viewer 개발하거나, 언론사 정책에 따른 디바이스별 서비스 전용 Viewer 개발하거나, 4단계 서비스시 인포그래픽등 인터랙티브한 뉴스서비스 모델 등 부가가치 높은 콘텐츠를 만들어 유료화 정책과 연계 개발하는 방식이 될 수 있습니다.
한 지역신문사 국제신문에서 지면서비스하는 형태인데, 네이버 서비스와 유사합니다. 다음의 경인일보에서 서비스하는 형태인데, 이미지 크롭 활용 예시로서 마우스로 해당 영역 이동시 제목을 풍선도움말 형식으로 보여줘서 모바일에서 유용하게 사용하게 만든 것입니다. 블록을 만드는 이유는 PC버전에서는 의미가 없고, 크기가 작은 모바일버전에서 중요하기 때문입니다. 해당 이미지를 크게 해서 사용할 수 있고, 다양한 서비스를 위해 블록형태로 만드는 것이 중요합니다. 다음은 기사블럭을 통해 웹형태로 보기, 이미지형태로 보기로 서비스하는 경우입니다. 또한 사용자가 원하는 날짜별, 면별로 찾거나 키워드로 다양하게 찾을수 있게 서비스하고 있습니다.
다음에 보시는 것은 비플라이소프트가 개발한 파오인 서비스입니다. 앞서 설명드렸듯이 UI만 다를뿐이지 기능은 대개 비슷합니다. 유료화로 서비스 되고 있으며 모바일 앱으로도 서비스를 하고 있어 다양한 디바이스에서 볼 수 있습니다.
이러한 지면서비스를 하고 있지만, 디지털화 사업을 통해서 실질적인 이득은 미미합니다. 과연 종이신문을 디지털화해서 어떤 효과를 낼건지 내부적으로 어떻게 할건지를 고민을 먼저해야 합니다. 그래서 과거기사가 향후 어떻게 발전될 수 있을까요. 저는 향후 이 부분이 어떻게 발전될 수 있는지 생각해 보았습니다. 과거기사 데이터베이스를 통한 기사 검색 영역 확대가 먼저 되겠지요. 다음은 과거기사를 기반으로 하는 반자동 인포그래픽 생성 연동입니다. 와닿지 않으실텐데, 예를 들어 ‘석유파동’이라고 해서 신문이 창간될때 부터 지금까지 어떻게 석유파동(유가상승)이 이슈화되었는지 연도별로 리스트업이 된다면 이를 통해서 쉽고 빠르게 인포그래픽도 만들 수 있지 않을까요. 물론 아이디어 기획은 여기 계신 조사기자의 몫이겠죠. 빅데이터를 활용한 기사분석 시스템으로 확대입니다. 이 부분은 어떻게 활용하고 어떻게 할건지는 기술이 미비하기 때문에 아주 어렵고, 어디까지 확대될지는 어려운 부분입니다. 로봇저널리즘처럼 숫자를 통해서 기사를 만들어 내는건 심플한데, 기사분석 시스템은 상당히 기술적이나 맥락적으로 어렵습니다.
중앙일보가 최근 도입한 CMS에는 키워드 엔진이 기사의 대표키워드를 생성하는데, 기자가 입력하지 않아도 기사의 키워드를 예시 추천하는 기능이 생겨서, 기자가 선택하게 되면 대표키워드가 되는 것입니다. 대표키워드가 생성된 것을 가지고, 엔진의 분석데이터 튜닝을 합니다. 결국 정형화된 형태로 기자가 원하는 키워드를 잡아내는 것은 튜닝의 과정에서 산출되는 결과입니다. 앞서서 아직까지는 그러한 기술이 쉽지가 않습니다. 삼성 S8 휴대폰만 보더라도 특정한 영역, 특정한 부분만 처리되는 구조이듯이 아직까지는 한계성이 있습니다. 과거기사 콘텐츠 재가공을 통한 유료화 콘텐츠 생성입니다. 예를들어 특정한 관계도, 정형화된 텍스트가 많지 않지 않습니다. 전문가가 작성한 기승전결로 체계화된 기사인데, 그것만 잘 분석만해도 그림으로 도식화 한다면, 부가가치가 높은 좋은 콘텐츠를 만들 수 있을 것입니다. 끝으로 통합 CMS에 연동한 2차 콘텐츠 생성시 편리성 제공인데, 세계일보, 한겨레신문, 중앙일보 등이 가시적 효과가 발생되고 있고, 한국일보 시도하려고 준비하고 있고, 언론진흥재단도 통합CMS를 각 신문사가 활용할 수 있도록 지원하고 있고, 이것이 과거기사에 연동된다면 기자가 기사를 쓰면서 과거의 사안에 대해서 미리 본다면, 더 쉽고 편리하게 기사를 작성하지 않을까 나름대로 생각해 보았습니다.
|