Курс Data Communication: Пишем о данных

Course Content

Total learning: 16 lessons Time: 10 weeks

Что такое данные и открытые данные

Короткое описание урока: Этот урок дает краткое введение в мир данных. Курс охватывает основные понятия и различные типы данных.

С помощью данных можно описать все вокруг нас. Но что это значит? Данные – это значения, присвоенные предмету. Возьмите, к примеру, банки меда на рисунке ниже.

Что мы можем о них сказать? Если это банки меда на продажу, то первое значение, которое приходит на ум – это цена. Но есть и еще.

Например, мед бывает разного сорта, это тоже даст нам много информации. Есть сезоны, есть место производства, вес, количество и качество. Все это – данные.

Из приведенного выше примера мы уже видим, что существуют разные типы данных. Двумя основными категориями являются качественные и количественные данные.

  • Качественные данные – это все, что относится к качеству чего-либо: цвет, текстура и другие признаки, которые можно объединить в категории.
  • Количественные данные – это те данные, которые выражены в числах. Например, вес меда, количество банок и т. д.

С данными удобно работать, когда они собраны и структурированы. Давайте сделаем это в таблице ниже.

Задание: определите, качественные или количественные данные в последней колонке.
ЦветБелыйКачественные
СортГорный?
Вес в банке 0,5 литров750 граммовКоличественные
ПроизводствоКыргызстан, Ат-Башы?
Цена200 сомов за банку?

Но каждое отдельно взятое значение все еще не приносит нам пользы. Чтобы извлечь информацию из данных, их нужно интерпретировать.

Давайте возьмем вес: то, что пол-литровая банка весит 750 грамм, не говорит нам много. Но это имеет смысл, когда мы сравниваем вес и объем одной банки с другими. К примеру, можно найти информацию о том, что пол-литра меда весит от 700 грамм. Хорошо, теперь мы знаем, что вес меда в рамках нормы. Это уже информация. Но это еще не знание. Знание создается, когда информация изучается, анализируется и приводит к чему-то.

Что такое открытые данные?

“Открытые данные могут быть свободно использованы, модифицированы, и распространены кем угодно в любых целях”.

Это принятое в международном сообществе определение открытых данных максимально сжато формулирует суть открытых данных. Использованы, модифицированы и распространены – это три критерия, по которым данные считаются и могут быть признаны открытыми.

Данные могут быть использованы, если они доступны в интернете. Модифицированы они могут быть, если предоставлены в формате, который позволяет это сделать. И, наконец, распространены кем угодно в любых целях данные могут быть, если за ними не закреплены авторские права.

Таким образом, все три условия на самом деле технические – публикация данных, формат и лицензия определяют их открытость. Идеология прозрачности и движения за открытые данные началась именно с той позиции, что сбор этих данных уже был оплачен гражданами как налогоплательщиками, а, следовательно, доступ к ним – это такое же право каждого человека, как и другие фундаментальные права.

Больше информации об открытых данных тут и тут.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *