Ще зовсім недавно друковані газети підшивали у величезні папки, складали у металеві ящики і зберігали у підвалах редакцій. Газети збирали пилюку й були пожежонебезпечними, проте інших способів зберігати їх було мало. У цифрову еру методи архівування газет могли стати більш витонченими, однак вони досі недосконалі. Як свідчить нове дослідження, важливі онлайн-дані втрачаються.
Ключові питання про те, як зберігати та архівувати цифровий контент, почали ставити лише нещодавно, хоча зберігати газети у цифровому форматі розпочали кілька десятиліть тому.
Кетлін Хансен (Kathleen A. Hansen) та Нора Пол (Nora Paul) з Університету Міннесоти (University of Minnesota) дослідили 10 медіа та їхні процеси архівації. Дев’ять із них первинно були традиційними газетами, і одне видання – від початку лише онлайновим.
Їхній звіт “Газетні архіви свідчать про головні прогалини цифрової ери” (“Newspaper archives reveal major gaps in digital age”) свідчить про низку проблем із тим, як онлайн-документація зберігається, відколи у 1990-их започаткували цифрову архівацію.
Традиційний метод зберігання газетних архівів у папках, бібліографічних покажчиках чи на мікрофільмах був незадовільним. Адже контент, що зберігається таким чином, зрештою втрачає якість; його також можуть загубити чи переплутати, особливо коли медіа закриваються, зливаються чи переходять із рук у руки.
Однак, велике цифрове сховище видається таким же проблематичним: ні традиційні видання, ні ті, що відразу виникли як цифрові, не мають зрозумілих стратегій, як архівувати та зберігати свої онлайн-ресурси, свідчить дослідження науковців з Університету Мінесоти. Стає відомо про втрату даних, як, наприклад, 34-частинна серія журналістських розслідувань, що потрапила у фінал Пулітцерівської премії.
“Цифрова інформація сама по собі має різноманітні переваги – окрім того, що коли вона втрачається, то втрачається по-справжньому, – каже Джейсон Скотт (Jason Scott), архіваріус та історик Інтернет-архіву (Internet Archive). – Вона зникає. Шматок паперу може згоріти, а вам все-таки щось від нього ще може залишитися. Із жорстким диском чи URL інакше – якщо вони зникають, то це вже порожній ресурс”.
Дослідження Університету Мінесоти виявило такі головні висновки:
Позитиви:
- Традиційні видання мають доступ до друкованих газет у багатьох форматах, доступних для редакції та суспільства;
- З початку до середини 2000-их зберігаються PDF-версії газет. Як правило, це робить зовнішній продавець. Проблема полягає в тому, що ці файли часто недоступні для пошуку.
Негативи:
- Дослідники виявляли прогалини в архівах, незалежно від того, чи газета є частиною мережі, володіє нею сім’я, один власник упродовж десятиліть чи її перепродували багато разів.
- Якщо раніше у редакції було від 10 до 15 бібліотекарів, то тепер в середньому є лише одна чи двоє осіб, хто впорядковує цифрову базу друкованого продукту.
- Внутрішній архів відрізняється від того, що може бачити аудиторія. Лише внутрішньо-редакційні архіви містять найповнішу форму того, що було опубліковано.
- Хоча цифрові фото-файли у більшості почали накопичуватися всередині 1990-их, тоді робилася лише позначка, що фото було частиною певної історії. У пізніших архівних системах вже намагалися зберегти фото разом із метаданими до нього.
- У семи із дев’яти традиційних медіа аналогові знімки є безкоштовними й розміщені у вільному доступі. Проте лише дві із дев’яти традиційних ЗМІ надають аудиторії доступ до їхніх цифрових фото-архівів.
- Графічні файли – ще одна проблема. Вони зберігаються на внутрішніх серверах або в окремих художників. Зміни у програмному забезпеченні чи проблеми сумісності роблять доступ до старішої графіки неможливим.
- Проблеми із системами управління контентом і серверами інколи унеможливлюють доступ до старіших версій веб-сайтів. Результатом цього є втрата даних.
- Ні первинно цифрові видання, ні веб-сайти газет не мають повного архіву своїх веб-сайтів. Зворотна сумісність із новими системами управління контенту чи зміни у веб-хостингу є проблематичними.
- Архівування мультимедійних елементів є поодиноким, якщо не взагалі відсутнім.
- Коментарі читачів до статей не архівуються, окрім рідкісних винятків, коли це робить зовнішній агент з певною метою.
- Контент соціальних медіа також не архівується. Йдеться про дописи для Facebook, Pinterest, Instagram, та Twitter.
- Традиційні медіа не архівують мобільного контенту. Серед 10 досліджуваних лише первинно цифрове медіа зберігає такі матеріали.
Потрібно усвідомити важливість зберігання цифрового контенту, оскільки газети відіграють важливу роль у нашому суспільстві – з політичної і бізнесової точки зору. Вони документують історію від самого заснування держави. Ця багата історія – під загрозою, зважаючи на нинішнє становище зі зберіганням цифрових новин. З часом цифрові дані втрачатимуться.
***
Більше за темою:
The Atlantic нещодавно звертався до проблеми зберігання цифрових даних, досліджуючи, як зникла з інтернету серія журналістських матеріалів – розслідування, що вийшло у фінал премії Пулітцера. Прочитайте, як репортер працює над тим, щоб “воскресити” свій проект.
Важливою є також робота Цифрового журналістського новинного архіву (Journalism Digital News Archive (JDNA) в Інституті журналістики Дональда Рейнольдса (the Donald W. Reynolds Journalism Institute). У відповідь на нинішній стан новинної індустрії був заснований перший “хранитель” становища журналістики. Інститут також досліджує найкращі практики архівування та доступу до контенту.
Стаття “Newspaper archives reveal major gaps in digital age” (pp. 390-398) вийшла у спеціальному випуску The Newspaper Research Journal за вересень 2015 року і доступна за посиланням: http://nrj.sagepub.com/content/36/3/290.short
Переклад з англійської мови статті “Storing – Or Losing – Digital News?”
Право на фото: Flickr Creative Commons Leww_pics
Tags: PDF-версії, Інтернет, інтернет-архів, архів, архіви, архівування, газети, дослідження, новини, цифрові версії, цифрові ЗМІ, цифрові медіа