Провідні західні видання мають свої рубрики з журналістики даних та регулярно готують спецпроекти, засновані на даних. Наприклад, про президентські вибори або Першу світову війну. В Україні ситуація – зовсім інша.
На журналістиці даних у нас спеціалізується лише сайт Texty.org.ua, який, проте, робить це якісно і завдяки цьому регулярно здобуває міжнародні нагороди. Економічні видання, в силу своєї специфіки, також працюють у сфері, яку можна назвати роботою з даними. Подекуди, цим займаються і громадські організації та аналітичні проекти, такі як VoxUkraine, ОПОРА або ЧЕСНО. Проте складнощів їхній роботі додає низька якість відкритих даних, з якими вони можуть працювати.
Наскільки дані “великі”?
З терміном “великі дані” світ познайомився у 2008 році, коли в журналі Nature була опублікована стаття про темпи зростання обсягів даних, продукованих різними галузями людської діяльності. Проте популярності ця тема набула в 2011-2012 роках, коли потужні фінансові та промислові компанії звернули увагу на великі дані як перспективний інструмент для передбачення поведінки клієнта. Зараз без них неможливо уявити роботу компанії, що обслуговує більше мільйона клієнтів на місяць. Правильна інтерпретація великих даних, дозволила, наприклад, компанії Amazon збільшити свою капіталізацію в 10 разів з 2008 року.
Трьома основними характеристиками великих даних, які відрізняють їх від звичайних, є обсяг, швидке накопичення нових даних та різноманіття. Чіткого визначення, які дані вважають великими не існує; є розмите поняття про те, що це ті дані, які неможливо обробити звичайними інструментами аналізу, наприклад, електронними таблицями.
Помилково стверджувати, що журналістика даних займається великими даними. Великі дані найчастіше генеруються клієнтами великих компаній і знаходяться у їхній власності. До наборів даних, які генеруються урядовими та муніципальними установами і якими можуть користуватися журналісти (однак, далеко не в усіх країнах), досить часто обмежений доступ або ж вони викладені у незручному для прочитання та використання форматі. 90% відкритих даних (ті, що мають бути у машинозчитувальному форматі у вільному доступі) в Україні зіпсовані. Тому журналісти даних працюють не просто з великими даними, а з даними, як джерелом інформації для своїх матеріалів.
Виклики для журналістів, які працюють із даними
Проблеми, з якими зіштовхуються журналісти даних, можна розділити на три категорії: технічні, політичні і етичні. Технічні полягають в тому, що виникла велика кількість інструментів, які журналісти мають опанувати. Це і скрепінг даних (завантаження текстових даних з веб-сайтів), і їх парсинг (виокремлення необхідної інформації із завантажених даних), і автоматизовний аналіз, і візуалізація. Часто для опанування інструментів, журналістам доводиться вчити мову програмування, насамперед R, Javascript або Python, розбиратися в тому, як працює Інтернет. В очах стороннього спостерігача це відводить їх з класичної журналістики кудись в бік розробки програмного забезпечення чи популярного зараз Data Science.
Політичні виклики, з якими зіштовхується журналістика даних, полягають в тому, що недоброчесні компанії або уряди, проти яких і працюють журналісти, також отримують додаткові важелі впливу на громадськість. Такими важелями впливу може бути банальна пропаганда різними каналами інформації або різноманітні обмеження інтернету, чим зараз займається Росія. Або це може бути гра з великими даними — їх модифікація або намагання використати у власних інтересах.
Етичний ж виклик залишився тим самим, що й десятиліття тому, просто став відповідати духу часу. Зараз журналісти можуть отримувати інформацію від викривача з протилежного боку Землі, не виходячи з-за свого робочого місця. Але з технічним прогресом зросли і загрози, які тепер виходять за звичайні для журналіста рамки. Так, наприклад, американське видання The Intercept випадково розкрило особу своєї інформаторки, яка повідомила про причетність російських спецслужб до президентської кампанії в США в 2016 році. Її видали ідентифікаційні крапки принтера на роздруківці скану роздруківки, котру журналісти передали американським спецслужбам для перевірки інформації. Або найпотужніша в історії атака на сайт журналіста, який їх деанонімізував.
Чому журналістика даних важлива?
- Вона змінює спосіб роботи з даними. Раніше велика частина роботи журналіста полягала в тому, щоб знайти і зібрати інформацію. Тепер більша частина цієї інформації доступна (щоправда, не в Україні). Робота журналіста полягає в тому, щоби інтерпретувати дані і знайти в них історію, яка буде цікавою читачеві.
- Це новий підхід до розповідання історій. Традиційні репортажні і новинні стилі доповнені новими медіа: рухомими графіками, аудіо, відео, веб-додатками. Це збільшило час і зусилля, необхідні журналістові на підготовку матеріалу, проте і поглибило читацький досвід, дало нові канали для розповідання історій.
- Це майбутнє. Великі дані проникають в усі галузі нашого життя (потроху – якщо йдеться про Україну). Рано чи пізно із ними доведеться мати справу кожному, щоби не стати «непотрібним», тим, хто не призвичаївся до технологічного життя майбутнього. Чим більше компетенцій матиме журналіст, тим ціннішим він буде на ринку праці, не тільки медійному.
- Це місток між “технарями” і “гуманітаріями”. Дані завжди вважалися цариною технічних спеціальностей, слова — гуманітарних. Зараз ці рамки знищені.
- Це інформаційний фільтр епохи постправди. Журналістика даних дає можливість перевіряти чиновників, дозволяючи журналістам ефективніше виконувати свою функцію “сторожових псів” демократії. Крім того, журналістика даних здатна гамувати емоції користувачів соціальних мереж.
- Це спрощення життя. Навіть якщо ви безпосередньо не готуєте матеріали на основі великих або не дуже великих даних, вміння користуватися інструментарієм журналістів даних значно підвищить повсякденну продуктивність. Наприклад, вам більше не доведеться виписувати цитати з PDF-документа вручну, тому що ви перетворите його на текстовий документ завдяки спеціалізованій програмі.
Зображення: Pixabay, TheDigitalArtist
Tags: великі дані, журналістика даних