Глоссарий по теме 1: «Что такое данные. Визуализация данных. Особенности биомедицинских данных»


Browse the glossary using this index

Special | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | ALL

Б

Биомедицинские данные

  • в общем случае, это данные (или информация), которая относится к здоровью человека. Эти данные используются для исследований, диагностики, лечения и профилактики заболеваний, а также для разработки новых лекарств и медицинских технологий. Они могут быть получены из различных источников, таких как медицинские обследования, лабораторные анализы, геномные исследования, медицинские изображения, носимые устройства и электронные медицинские карты.
Особенности биомедицинских данных:
  • Многообразие форматов и типов
  •  Высокий объем
  • Сложность интерпретации
  • Высокая ценность и чувствительность
  • Неоднородность
  • Динамичность
  • Этические и правовые аспекты
  • Потенциал для анализа и машинного обучения
  • Неполнота и шум



Большие данные

  • это разнообразные данные, поступающие с высокой скоростью и требующие специальных средств их обработки.

Свойства больших данных:

  1. разнообразие
  2. высокая скорость поступления
  3. большой объем


Д

Данные

  • это представление информации в формальном виде, пригодном для передачи, интерпретации или обработки (ГОСТ Р ИСО/МЭК 20546-2021. Информационные технологии. БОЛЬШИЕ ДАННЫЕ).

  • это факты или информация, которые можно использовать для отчетности, расчетов, планирования или анализа. (Свод знаний по управлению данными DMBOK (Data Management Body of Knowledge), 2009


Датасет

(англ. dataset)

  • это обработанный и структурированный массив данных, готовый для анализа, исследования и использования в различных вычислительных задачах.


Дашборд

  • это инструмент визуализации данных, который предоставляет ключевую информацию в удобном и наглядном виде. Он представляет собой панель с графиками, диаграммами, таблицами и другими элементами, которые помогают быстро анализировать данные, отслеживать показатели и принимать решения. Дашборды широко используются в бизнесе, аналитике, медицине, маркетинге и других областях.


И

Информация

  • форматированные данные, обработанные и интерпретированные с определенной целью, которым придан смысл посредством добавления контекста. Обработанные данные являются информацией.

Данные и информация тесно переплетены и по отдельности не существуют. 

Данные — это форма информации, а информация — это форма данных.



Н

Наука о данных

(англ. data science; иногда даталогия – datalogy) 

  • раздел информатики, изучающий проблемы анализа, обработки и представления данных в цифровой форме.



О

Открытые данные

  • это информация, размещенная в сети интернет в виде систематизированных данных, организованных в формате, обеспечивающем ее автоматическую обработку без предварительного изменения человеком, в целях неоднократного, свободного и бесплатного использования (Федеральный Закон «Об обеспечении доступа к информации о деятельности государственных органов и органов местного самоуправления», 2009 год)


Т

Типы данных

По назначению:

  • Метаданные - описывают структуру и характеристики данных
  • Основные данные  - данные об объектах
  • Справочные данные – данные из справочников, международных, общероссийских и отраслевых классификаторов и т. п.

По структуре:

  • Структурированные - данные, имеющие строго определённую структуру, определяемую формальной моделью данных (например, таблицы)
  • Неструктурированные - данные, произвольные по форме, не имеющие строго определенной структуры и не организованные по определенным правилам (например текст или видео)


Типы сбора данных

  1. Ручной сбор
  2. Автоматизированный сбор
  3. Сбор данных с помощью сенсоров и датчиков
  4. Опросы и интервью
  5. Статистические данные
  6. Веб-скрейпинг или парсинг