Инструменты

Расширенный поиск Google

Сложность: Низкая

Применение: Поиск данных

Пара ключевых слов, добавленных в простой поиск в Google, поможет найти вам большинство данных, доступных онлайн. В продвинутом поиске можно задать формат и дату публикации файла, а также сузить поиск до определенных вебсайтов (например, Нацстаткома или базы данных ВОЗ).

Веб-сервис бесплатный.

Zamzar

Сложность: Низкая

Применение: Поиск данных

Базовый вебсайт для скрейпинга файлов. Этот сервис позволит вам экспортировать табличные данные из PDF и Word файлов. Тем не менее, этим Zamzar не ограничивается: как утверждают создатели, можно конвертировать 1200 различных форматов.

Веб-сервис бесплатный.

Tabula

Сложность: Средняя

Применение: Поиск данных

Более продвинутое и мощное, чем Zamzar, приложение для скрейпинга, особенно удобное при работе с докладами и таблицами в PDF формате. Гибкий интерфейс позволяет выбирать отдельные таблицы в документе, которые программа конвертирует в табличный формат.

Приложение бесплатное.

Google Dataset Search

Сложность: Низкая

Применение: Поиск данных

Поисковик, который работает исключительно с базами данных. В теории, такой поиск можно сделать и в обычной строке Google с добавлением ключевых слов “site:” и “filetype:”, но Dataset Search сразу показывает периодичность, географию и краткое описание данных. Сервис пока плохо работает с русскоязычными базами, но дает хорошие данные о Кыргызстане из англоязычных ресурсов.

Веб-сервис бесплатный.

Microsoft Office Excel

Сложность: Средняя

Применение: Чистка Анализ Визуализация

Важный инструмент для начинающего дата-журналиста. Вы можете использовать его для чистки, анализа и визуализации данных. Кроме того, Excel содержит много функций продвинутого уровня: например, линейные регрессии и аннотированные диаграммы. Интерфейс делает его особенно удобным при подготовке данных к анализу.

Программа платная, бесплатные альтернативы: Google Spreadsheets, OpenOffice.

Google Sheets

Сложность: Средняя

Применение: Поиск данных Чистка Анализ Визуализация

Бесплатная и мощная альтернатива Excel, которая проигрывает ему по некоторым факторам, но незаменима при совместной работе. Microsoft Office богаче в выборе формул и визуализаций, но Google Sheets позволяет нескольким людям работать над одним документом одновременно и хранить ваши данные в облаке. (Стоит отметить, что в Excel тоже недавно появилась возможность онлайн-коллаборации: см. Google Excel Online).

Веб-сервис бесплатный.


Datawrapper

Сложность: Средняя

Применение: Визуализация

Инструмент для визуализации данных, хорошо работающий в веб-приложениях. Если вы справляетесь с визуализациями в Excel, проблем с этим сервисом не будет. В Datawrapper можно создавать гибкие бар чарты, скаттер плоты и линии, добавлять текст и редактировать цвета. Главный его плюс: интеграция с HTML и CSS. Для добавления интерактивного графика на сайт достаточно скопировать небольшой кусок кода.

Веб-сервис бесплатный.

Draw.io

Сложность: Низкая

Применение: Визуализация

Вебсайт для создания схем и диаграмм. Пригодится, если вам нужно создать простой таймлайн или схему. Сервис интегрирован с Google Drive и прост в использовании.

Веб-сервис бесплатный.

Pixelmap

Сложность: Низкая

Применение: Визуализация

Базовый инструмент для создания карт вручную. Работать можно на масштабе карты мира, отдельной страны или (в некоторых случаях) отдельного города. Карта Кыргызстана разбита на области.

Веб-сервис бесплатный.

Infogram

Сложность: Низкая

Применение: Визуализация Сторителлинг

Простой инструмент для визуализации данных, поддерживающий веб-интеграцию. Для создания графиков не нужны даже файлы с данными: вы можете ввести цифры вручную. Хорошо подойдет для тех, кто ещё не силен в чистке данных и работе с табличными файлами. График можно скачать на компьютер или напрямую вставить на вебсайт.

Веб-сервис бесплатный.

Canva

Сложность: Низкая

Применение: Визуализация Сторителлинг

Вебсайт, оригинально предназначенный для создания постеров, логотипов и афиш, но полезный и при оформлении дата-журналистских историй. Простой интерфейс и богатая библиотека символов и изображений позволят создать инфографику, таймлайны и схемы.

Веб-сервис бесплатный.

Tilda

Сложность: Низкая

Применение: Визуализация Сторителлинг

Сервис для создания и хостинга сайтов. Подойдет для тех, кто хочет опубликовать свою историю отдельно от медиа, или для редакторов, которым нужно оформить большой мультимедийный проект.

Сервис бесплатный при хостинге на субдомене .tilda.ws.

Carto

Сложность: Средняя

Применение: Анализ Визуализация

Мощное приложение для создания карт на основе данных. Поддерживается интеграция с разными видами данных и различные виды аннотаций. Также поддерживается создание собственных карт и границ.

Веб-сервис платный. Бесплатные альтернативы: QGIS.

Tableau Public

Сложность: Средняя

Применение: Анализ Визуализация Сторителлинг

Продукт для аналитики и визуализации данных. Непростой в использовании инструмент, который позволяет создать дэшборды и визуальные истории на данных. Все элементы графики можно настраивать. Графический интерфейс упрощает работу, поэтому Tableau  выступает как альтернатива языкам программирования Python и R при визуализации данных.

Программа бесплатная, есть платная версия.

Github

Сложность: Средняя

Применение: Чистка Поиск данных

Полезный сервис для команды. Это как Google Drive, только для кода и небольших данных: Github синхронизирует изменения в файлах вашей папки, и позволяет автоматически делиться ими с членами команды. Для полноценной работы, скачайте десктопное приложение Github Desktop (вам придется освоить принципы commit и push и присоединиться к касте девелоперов).

Приложение бесплатное.

SQL

Сложность: Высокая

Применение:Поиск данных  Чистка

Язык программирования, предназначенный для баз данных. Пригодится, если вам нужно выкачать базу данных или если вы хотите систематизировать ваши собственные массивы данных. Для работы с SQL не помешает базовое знание теории множеств.

Язык программирования open source и бесплатен для использования. Управлять базами данных можно в MySQL.

Python

Сложность: Высокая

Применение: Поиск данных  Чистка Анализ Визуализация

Один из главных языков программирования для анализа данных. Основные плюсы: простой синтаксис, обширное количество библиотек, поддержка больших компаний (например, библиотека TensorFlow разработана Google) и большое коммьюнити пользователей. Необходимый инструмент при работе с большими массивами данных, обучении нейронных сетей и создании сложных визуализаций.

Язык программирования open source и бесплатен для использования. Писать код можно в бесплатном PyCharm.

R

Сложность: Высокая

Применение: Поиск данных  Чистка Анализ Визуализация

Второй главный язык программирования для анализа данных. В отличии от Python, R создан специально для статистических моделей. Также поддерживает большое количество библиотек для визуализации данных.

Язык программирования open source и бесплатен для использования. Писать код можно в бесплатном RStudio.