Задания. Работа с открытыми государственными данными и визуализация данных.
Site: | Образовательный портал Казанского ГМУ |
Course: | Медицинская информатика (МОДУЛЬ 1) : 2 курс педиатрический и медико-профилактический факультеты |
Book: | Задания. Работа с открытыми государственными данными и визуализация данных. |
Printed by: | Гость |
Date: | Thursday, 3 April 2025, 10:39 PM |
1. Задание 1.1. Работа с открытыми данными
1.1. Поиск на портале открытых данных Росздравнадзора РФ: https://roszdravnadzor.gov.ru/opendata
1.2. Выберите набор данных в "Реестре наборов открытых данных", кликните на него.
1.3. Выберите данные: "Сведения об информационных письмах по контролю за обращением медицинских изделий" (№24)
1.4. Внимательно прочитайте название и все мета-данные указанные внутри.
1.5. В строке 8 "Гиперссылка (URL) на открытые данные" - скачайте файл формата .csv
1.6. Для работы с данными в режиме офлайн, то есть без доступа к интернету, нужно скачать файл в формате CSV.
1.7. Откройте пустой файл Excel, а затем на пустом листе откройте загруженный файл с помощью следующей процедуры: Вкладка Данные –> Получение внешних данных –> Из текста. Выберите файл, который нужно преобразовать и нажмите Импорт.
Например, в версии Microsoft Office 2021 выберите «Данные»:
Далее, Получить данные «из текстового / CSV-файла»:
Далее, выбирайте необходимый файл и проверяете его отображение (проверьте правильность выбранного языка, разделителя файлов и прочее):
1.8. Изучите представленные данные и попробуйте сделать заключение по какому-либо параметру на выбор. Например, можете ответить на эти вопросы:
1.8.1. Сколько всего писем зарегистрировано?
1.8.2. Когда поступило первое зарегистрированное письмо?
1.8.3. Когда поступило последнее?
1.9. Введите свой вывод в поле на Листе 2 (создайте лист самостоятельно).
1.10. На Листе 2 также укажите мета-данные:
- Наименование набора данных
- Дату последнего внесения изменений
- Владелец набора данных
- Ответственное лицо
- Телефон ответственного лица
- Адрес электронной почты ответственного лица
1.11. Сохраните файл в формате xls с названием: "Номер группы_ФИО" и загрузите его в качестве выполненного задания сюда (ссылки):
2. Задание 1.2. Работа с открытыми данными
1.1. Зайдите на сайт Росстата раздел Статистика https://rosstat.gov.ru/statistic
1.2. Выберите пункт Переписи населения - Всероссийская перепись населения 2020 года.
1.3. Выберите пункт «Итоги ВПН-2020». Том 1. «Численность и размещение населения».
1.4. Скачайте и откройте Файл 5. «Численность населения России, федеральных округов, субъектов Российской Федерации, городских округов, муниципальных районов, муниципальных округов, городских и сельских поселений, городских населенных пунктов, сельских населенных пунктов с населением 3000 человек и более».
1.5. Найдите данные по вашему региону. Ответьте на вопросы в свободной форме в документе Word:
- Сколько в вашем регионе городских округов с числом жителей 1 млн и более?
- Сколько в вашем регионе городских округов всего?
- В регионе проживает больше мужчин или женщин?
1.5.4. Выберите город и ответьте на вопросы:
- В каком районе города проживает больше всего человек?
- В каком районе города проживает меньше всего человек?
- Какого населения в регионе больше – городского или сельского?
1.6. Прикрепите документ в формате Word с названием "Номер группы_ФИО" с ответами на эти вопросы.
Ниже пример оформления титульного листа:
1.7. Сохраните документ и приложите сюда (ссылки):
3. Задание 2. Визуализация данных. Интерпретация дашборда
1. Выберите из представленных ниже ссылок наиболее интересную Вам визуализацию:
- Разные виды спорта, включенные в Олимпийские игры в разные периоды времени: https://public.tableau.com/app/profile/nastengraph/viz/SummerOlympicsProgram/SummerOlympicsProgram
- Индекс счастья разных стран: https://public.tableau.com/app/profile/nastengraph/viz/DashboardofthePresentFuture/PresentFuture
- Самые высокооплачиваемые спортсмены: https://public.tableau.com/app/profile/nastengraph/viz/MoMHighest-PaidAthletes/Highest-PaidAthletes2023
2. Внимательно исследуйте информационный дашборд и опишите информацию, которую оттуда можно почерпнуть.
Общие вопросы о дашборде
- Какова основная цель этого дашборда: какую информацию он предоставляет и для кого он может быть полезен?
- Какие визуализации используются на дашборде: опишите типы графиков (например, столбчатые диаграммы, карты, линейные графики) и их назначение.
- Какие данные представлены на дашборде: перечислите ключевые показатели (например, имена спортсменов, виды спорта, доход, источники дохода; или население, ВВП, уровень счастья, экологические показатели; или имена спортсменов, виды спорта, доход, источники дохода).
Вопросы по анализу данных:
Для дашборда № 1:
- Какие виды спорта наиболее популярны (имеют наибольшее количество представлений на Олимпийских играх): проанализируйте данные и назовите топ-3 вида спорта
- Какие виды спорта наименее популярны (имеют наименьшее количество представлений на Олимпийских играх): проанализируйте данные и назовите топ-3 вида спорта
- Какая страна имеет самый высокий уровень счастья: используйте карту или график, чтобы определить страну с наивысшим показателем.
- Как соотносятся ВВП и уровень счастья в разных странах: проанализируйте, есть ли зависимость между этими показателями
- Кто является самым высокооплачиваемым спортсменом в 2023 году: Используйте график или таблицу, чтобы определить спортсмена с наибольшим доходом.
- Какой вид спорта приносит наибольший доход спортсменам: проанализируйте данные и назовите топ-3 вида спорта.
- Каковы основные источники дохода для спортсменов: опишите, какую долю составляют заработная плата, endorsements (рекламные контракты) и другие источники.
Вопросы по взаимодействию с дашбордом:
- Как можно использовать фильтры на дашборде: опишите, как фильтры помогают уточнить данные (например, по видам спорта, источникам дохода; ИЛИ по регионам, годам или показателям; ИЛИ по видам спорта, источникам дохода).
- Какие интерактивные элементы есть на дашборде: например, всплывающие подсказки, кликабельные элементы, изменение масштаба.
Вопросы на интерпретацию и выводы:
- Какие тенденции или закономерности вы можете выделить на основе данных: например, связь между видом спорта и уровнем дохода, популярность спортсменов в рекламных контрактах; ИЛИ рост или снижение количества медалей у определенных стран, изменение популярности видов спорта; ИЛИ связь между уровнем счастья и экономическими показателями.
- Как бы вы улучшили этот дашборд: предложите дополнительные визуализации, фильтры или показатели, которые могли бы сделать дашборд более информативным.
3. Приложите файл с названием "Номер группы_ФИО" в формате .doc с описанием к заданию.
Пример титульного листа ниже:
4. Сохраните документ и приложите сюда (ссылки):