Биомедицинские данные - в общем случае, это данные (или информация), которая относится к здоровью человека. Эти данные используются для исследований, диагностики, лечения и профилактики заболеваний, а также для разработки новых лекарств и медицинских технологий. Они могут быть получены из различных источников, таких как медицинские обследования, лабораторные анализы, геномные исследования, медицинские изображения, носимые устройства и электронные медицинские карты.
Особенности биомедицинских данных:
- Многообразие форматов и типов
- Высокий объем
- Сложность интерпретации
- Высокая ценность и чувствительность
- Неоднородность
- Динамичность
- Этические и правовые аспекты
- Потенциал для анализа и машинного
обучения
- Неполнота и шум
|
|
Большие данные - это разнообразные данные, поступающие с высокой скоростью
и требующие специальных средств их обработки.
Свойства больших
данных:
- разнообразие
- высокая скорость поступления
- большой объем
|
|
Данные - это представление информации в
формальном виде, пригодном для передачи, интерпретации или обработки (ГОСТ Р
ИСО/МЭК 20546-2021. Информационные технологии. БОЛЬШИЕ ДАННЫЕ).
- это факты или информация,
которые можно использовать для отчетности, расчетов, планирования или анализа. (Свод знаний по управлению данными DMBOK (Data Management Body of Knowledge),
2009
|
|
Датасет (англ. dataset) - это обработанный и структурированный массив
данных, готовый для анализа, исследования и использования в различных
вычислительных задачах.
|
|
Дашборд - это инструмент визуализации данных, который предоставляет
ключевую информацию в удобном и наглядном виде. Он представляет собой панель с
графиками, диаграммами, таблицами и другими элементами, которые помогают быстро
анализировать данные, отслеживать показатели и принимать решения. Дашборды
широко используются в бизнесе, аналитике, медицине, маркетинге и других
областях.
|
|
Информация - форматированные данные, обработанные и интерпретированные с
определенной целью, которым придан смысл посредством добавления контекста.
Обработанные данные являются информацией.
Данные и информация
тесно переплетены и по отдельности не существуют. Данные — это форма
информации, а информация — это форма данных. |
|
Наука о данных (англ. data science; иногда даталогия – datalogy) - раздел
информатики, изучающий проблемы анализа, обработки и представления данных в
цифровой форме.
|
|
Открытые данные - это информация, размещенная в сети интернет в виде
систематизированных данных, организованных в формате, обеспечивающем ее
автоматическую обработку без предварительного изменения человеком, в целях
неоднократного, свободного и бесплатного использования (Федеральный Закон «Об обеспечении
доступа к информации о деятельности государственных органов и органов местного
самоуправления», 2009 год)
|
|
Типы данных По
назначению:
- Метаданные - описывают структуру и характеристики данных
- Основные данные - данные об объектах
- Справочные данные – данные из
справочников, международных, общероссийских и отраслевых классификаторов и т.
п.
По
структуре:
- Структурированные - данные, имеющие строго определённую структуру,
определяемую формальной моделью данных (например, таблицы)
- Неструктурированные - данные, произвольные по форме, не имеющие строго определенной
структуры и не организованные по определенным правилам (например текст или
видео)
|
|
Типы сбора данных
- Ручной сбор
- Автоматизированный сбор
- Сбор данных с помощью сенсоров и датчиков
- Опросы и интервью
- Статистические данные
- Веб-скрейпинг или парсинг
|
|