Инструменты
Сложность: Низкая
Применение: Поиск данных

Пара ключевых слов, добавленных в простой поиск в Google, поможет найти вам большинство данных, доступных онлайн. В продвинутом поиске можно задать формат и дату публикации файла, а также сузить поиск до определенных вебсайтов (например, Нацстаткома или базы данных ВОЗ).

Веб-сервис бесплатный.

Сложность: Низкая
Применение: Поиск данных

Базовый вебсайт для скрейпинга файлов. Этот сервис позволит вам экспортировать табличные данные из PDF и Word файлов. Тем не менее, этим Zamzar не ограничивается: как утверждают создатели, можно конвертировать 1200 различных форматов.

Веб-сервис бесплатный.
Сложность: Средняя
Применение: Поиск данных

Более продвинутое и мощное, чем Zamzar, приложение для скрейпинга, особенно удобное при работе с докладами и таблицами в PDF формате. Гибкий интерфейс позволяет выбирать отдельные таблицы в документе, которые программа конвертирует в табличный формат.

Приложение бесплатное.
Сложность: Низкая
Применение: Поиск данных

Поисковик, который работает исключительно с базами данных. В теории, такой поиск можно сделать и в обычной строке Google с добавлением ключевых слов "site:" и "filetype:", но Dataset Search сразу показывает периодичность, географию и краткое описание данных. Сервис пока плохо работает с русскоязычными базами, но дает хорошие данные о Кыргызстане из англоязычных ресурсов.

Веб-сервис бесплатный.
Сложность: Средняя
Применение: Чистка, Анализ, Визуализация

Важный инструмент для начинающего дата-журналиста. Вы можете использовать его для чистки, анализа и визуализации данных. Кроме того, Excel содержит много функций продвинутого уровня: например, линейные регрессии и аннотированные диаграммы. Интерфейс делает его особенно удобным при подготовке данных к анализу.

Программа платная, бесплатные альтернативы: Google Spreadsheets, OpenOffice.
Сложность: Средняя
Применение: Поиск данных, Чистка, Анализ, Визуализация

Бесплатная и мощная альтернатива Excel, которая проигрывает ему по некоторым факторам, но незаменима при совместной работе. Microsoft Office богаче в выборе формул и визуализаций, но Google Sheets позволяет нескольким людям работать над одним документом одновременно и хранить ваши данные в облаке. (Стоит отметить, что в Excel тоже недавно появилась возможность онлайн-коллаборации: см. Google Excel Online).

Веб-сервис бесплатный.
Сложность: Средняя

Применение: Визуализация

Инструмент для визуализации данных, хорошо работающий в веб-приложениях. Если вы справляетесь с визуализациями в Excel, проблем с этим сервисом не будет. В Datawrapper можно создавать гибкие бар чарты, скаттер плоты и линии, добавлять текст и редактировать цвета. Главный его плюс: интеграция с HTML и CSS. Для добавления интерактивного графика на сайт достаточно скопировать небольшой кусок кода.

Веб-сервис бесплатный.
Сложность: Низкая
Применение: Визуализация

Вебсайт для создания схем и диаграмм. Пригодится, если вам нужно создать простой таймлайн или схему. Сервис интегрирован с Google Drive и прост в использовании.

Веб-сервис бесплатный.
Сложность: Низкая
Применение: Визуализация

Базовый инструмент для создания карт вручную. Работать можно на масштабе карты мира, отдельной страны или (в некоторых случаях) отдельного города. Карта Кыргызстана разбита на области.

Веб-сервис бесплатный.
Сложность: Низкая
Применение: Визуализация, Сторителлинг

Простой инструмент для визуализации данных, поддерживающий веб-интеграцию. Для создания графиков не нужны даже файлы с данными: вы можете ввести цифры вручную. Хорошо подойдет для тех, кто ещё не силен в чистке данных и работе с табличными файлами. График можно скачать на компьютер или напрямую вставить на вебсайт.

Веб-сервис бесплатный.

Сложность: Низкая
Применение: Визуализация, Сторителлинг

Вебсайт, оригинально предназначенный для создания постеров, логотипов и афиш, но полезный и при оформлении дата-журналистских историй. Простой интерфейс и богатая библиотека символов и изображений позволят создать инфографику, таймлайны и схемы.

Веб-сервис бесплатный.
Сложность: Низкая
Применение: Визуализация, Сторителлинг

Сервис для создания и хостинга сайтов. Подойдет для тех, кто хочет опубликовать свою историю отдельно от медиа, или для редакторов, которым нужно оформить большой мультимедийный проект.

Сервис бесплатный при хостинге на субдомене .tilda.ws.

Сложность: Средняя
Применение: Анализ, Визуализация

Мощное приложение для создания карт на основе данных. Поддерживается интеграция с разными видами данных и различные виды аннотаций. Также поддерживается создание собственных карт и границ.

Веб-сервис платный. Бесплатные альтернативы: QGIS.
Сложность: Средняя
Применение: Анализ, Визуализация, Сторителлинг

Продукт для аналитики и визуализации данных. Непростой в использовании инструмент, который позволяет создать дэшборды и визуальные истории на данных. Все элементы графики можно настраивать. Графический интерфейс упрощает работу, поэтому Tableau выступает как альтернатива языкам программирования Python и R при визуализации данных.

Программа бесплатная, есть платная версия.
Сложность: Средняя
Применение: Чистка, Поиск данных

Полезный сервис для команды. Это как Google Drive, только для кода и небольших данных: Github синхронизирует изменения в файлах вашей папки, и позволяет автоматически делиться ими с членами команды. Для полноценной работы, скачайте десктопное приложение Github Desktop (вам придется освоить принципы commit и push и присоединиться к касте девелоперов).

Приложение бесплатное.
SQL
Сложность: Высокая
Применение:Поиск данных, Чистка

Язык программирования, предназначенный для баз данных. Пригодится, если вам нужно выкачать базу данных или если вы хотите систематизировать ваши собственные массивы данных. Для работы с SQL не помешает базовое знание теории множеств.

Язык программирования open source и бесплатен для использования. Управлять базами данных можно в MySQL.

Python
Сложность: Высокая
Применение: Поиск данных, Чистка Анализ, Визуализация

Один из главных языков программирования для анализа данных. Основные плюсы: простой синтаксис, обширное количество библиотек, поддержка больших компаний (например, библиотека TensorFlow разработана Google) и большое коммьюнити пользователей. Необходимый инструмент при работе с большими массивами данных, обучении нейронных сетей и создании сложных визуализаций.

Язык программирования open source и бесплатен для использования. Писать код можно в бесплатном PyCharm.

R
Сложность: Высокая
Применение: Поиск данных, Чистка Анализ, Визуализация

Второй главный язык программирования для анализа данных. В отличии от Python, R создан специально для статистических моделей. Также поддерживает большое количество библиотек для визуализации данных.

Язык программирования open source и бесплатен для использования. Писать код можно в бесплатном RStudio.
Свяжитесь с нами
School of Data 2021 © All rights reserved
Бишкек, мкр. Асанбай, 27/1
@schoolofdatakg
schoolofdatakg@gmail.com
+996 500 605 406