Instruments

Расширенный поиск Google

Сложность: Низкая

Применение: Поиск данных

Пара ключевых слов, добавленных в простой поиск в Google, может найти вам большинство данных, доступных онлайн. В продвинутом поиске можно задать формат и дату публикации файла, а также сузить поиск до определенных вебсайтов (например, Нацстаткома или базы данных ВОЗ).

Веб-сервис бесплатный.

Zamzar

Сложность: Низкая

Применение: Поиск данных

Базовый вебсайт для скрейпинга файлов. Этот сервис позволит вам экспортировать табличные данные из PDF и Word файлов. Тем не менее, этими файлами Zamzar не ограничивается: как утверждают создатели, можно конвертировать 1200 разных форматов.

Веб-сервис бесплатный.

Tabula

Сложность: Средняя

Применение: Поиск данных

“Более продвинутое и мощное чем Zamzar приложение для скрейпинга, особенно удобное при работе с докладами и таблицами в PDF формате. Гибкий интерфейс позволяет выбирать страницы и поля в документе, которые программа конвертирует в табличный формат.

Приложение бесплатное.”

Google Sheets

Сложность: Средняя

Применение: Анализ Чистка Поиск данных Визуализация

Бесплатная и мощная альтернатива Excel, которая проигрывает по некоторым факторам, но незаменима при коллаборациях. Microsoft Office богаче в выборе формул и визуализаций, но Google Sheets позволяет нескольким людям работать над одним документом одновременно и хранить ваши данные в облаке. (Стоит отметить, что в Excel тоже недавно появилась возможность онлайн-коллаборации: см. Google Excel Online).

Веб-сервис бесплатный

Microsoft Office Excel

Сложность: Средняя

Применение: Анализ Чистка Поиск данных Визуализация

Важный инструмент для начинающего дата-журналиста. Вы можете использовать его для чистки, анализа и визуализации данных. Кроме того, Excel содержит много функций продвинутого уровня: например, линейные регрессии и аннотированные диаграммы. Интерфейс делает его особенно удобным при подготовке данных к анализу.

Программа платная, бесплатные альтернативы: Google Spreadsheets, OpenOffice.

Google Dataset Search

Сложность: Низкая

Применение: Поиск данных

Поисковик, который работает исключительно с базами данных. В теории, такой поиск можно сделать и в обычной строке Google с добавлением ключевых слов “site:” и “filetype:”, но Dataset Search сразу показывает периодичность, географию и краткое описание данных. Сервис пока плохо работает с русскоязычными базами, но дает хорошие данные о Кыргызстане из англоязычных ресурсов.

Веб-сервис бесплатный.

Pixelmap

Сложность: Низкая

Применение: Визуализация

Базовый инструмент для ручного создания карт. Работать можно на масштабе карты мира, отдельной страны или (в некоторых случаях) отдельного города. Карта Кыргызстана разбита на области.

Веб-сервис бесплатный.

Draw.io

Сложность: Низкая

Применение: Визуализация

Вебсайт для создания схем и диаграмм. Пригодится, если вам нужно создать простой таймлайн или дерево блоков. Сервис интегрирован с Google Drive и прост в использовании.

Веб-сервис бесплатный.

Datawrapper

Сложность: Средняя

Применение: Визуализация

Инструмент для визуализации данных, хорошо работающий в веб-приложениях. Если вы справляетесь с визуализациями в Excel, проблем с этим сервисом не будет. В Datawrapper можно создавать гибкие бар чарты, скаттер плоты и линии, добавлять текст и редактировать цвета. Главный его плюс: интеграция с HTML и CSS. Для добавления интерактивного графика на сайт, достаточно скопировать небольшой кусок кода.

Веб-сервис бесплатный.

Infogram

Сложность: Низкая

Применение: Визуализация

Простой инструмент для визуализации данных, поддерживающий веб-интеграцию. Для создания графиков не нужны даже файлы с данными: вы можете ввести цифры вручную. Хорошо подойдет для тех, кто ещё не силен в чистке данных и работе с табличными файлами. График можно скачать на компьютер или напрямую скопировать на вебсайт.

Веб-сервис бесплатный.

Tilda

Сложность: Низкая

Применение: Визуализация

Сервис для создания и хостинга сайтов. Подойдет для тех, кто хочет опубликовать свою историю отдельно, без аффилиацией с каким-либо медиа, или для редакторов, которым нужно оформить большой мультимедийный проект.

Сервис бесплатный при хостинге на субдомене .tilda.ws.

Canva

Сложность: Низкая

Применение: Визуализация

Вебсайт, оригинально предназначеный для создания постеров, логотипов и афиш, но полезный и при оформлении дата-журналистских историй. Простой интерфейс и богатая библиотека символов и изображений позволит создать таймлайны и деревья блоков.

Веб-сервис бесплатный.

Github

Сложность: Средняя

Применение: Чистка Поиск данных

Полезный сервис для команды. Это как Google Drive, только для кода и небольших данных: Github синхронизирует любые изменения в файлах вашей папки, и позволяет делиться ими с членами команды без лишних манипуляций. Для полноценной работы, скачайте десктопное приложение Github Desktop (вам придется освоить принципы commit и push и присоединиться к касте девелоперов).

Приложение бесплатное.

Carto

Сложность: Средняя

Применение: Анализ Визуализация

Мощное приложение для создания карт на основе данных. Поддерживается интеграция с разными видами данных и различные виды лейбелинга данных. Также поддерживается нанесение кастомизированных карт и границ.

Веб-сервис платный. Бесплатные альтернативы: QGIS.

Tableau Public

Сложность: Средняя

Применение: Анализ Визуализация

Среда для работы с данными, фокусирующаяся на сложных визуализациях. Сложный в использовании инструмент и альтернатива языкам программирования Python и R при визуализации данных. Графический интерфейс упрощает работу с Tableau, но сервис лучше использовать, когда вам нужны неочевидные графики.

Программа бесплатная для личного использования.

Python

Сложность: Высокая

Применение: Анализ Чистка Поиск данных Визуализация

Один из главных языков программирования для анализа данных. Основные плюсы: простой синтакс, обширное количество библиотек, поддержка больших компаний (например, библиотека TensorFlow разработана Google) и большое коммьюнити пользователей. Необходимый инструмент при работе с большими массивами данных, обучении нейронных сетей и создании сложных визуализаций.

Язык программирования open source и бесплатен для использования. Писать код можно в бесплатном PyCharm.

R

Сложность: Высокая

Применение: Анализ Чистка Поиск данных Визуализация

Похожий на Python язык программирования, также широко использующийся в коммьюнити дата-аналитиков. Более узкоспециализированный язык созданный специально для статистических моделей и выигрывающий разнообразием библиотек для визуализации данных.

Язык программирования open source и бесплатен для использования. Писать код можно в бесплатном RStudio.

SQL

Сложность: Высокая

Применение: Чистка Поиск данных

Язык программирования, предназначенный для баз данных. Пригодится, если вам нужно выкачать базу данных или если вы хотите систематизировать ваши собственные массивы. Для работы с SQL, вам пригодится базовое знание теории множеств.

Open source и бесплатен для использования. Управлять базами данных можно в MySQL.