Data Science негіздері

Бакланова Ольга Евгеньевна

Оқытушының портфолиосы

Сипаттама: Пән деректер ғылымының негізгі ұғымдары мен деректермен жұмыс істеудің негізгі кезеңдері туралы базалық түсінік қалыптастырады: деректерді жинау, алдын ала өңдеу, талдау, визуализациялау және нәтижелерді интерпретациялау. Python тілін деректерді талдау үшін қолданудың негіздері, Jupyter Notebook ортасында жұмыс істеу, NumPy, pandas, matplotlib, seaborn кітапханалары, сондай-ақ статистикалық талдау мен машиналық оқытудың бастапқы әдістері қарастырылады. Студенттер деректер жиынтықтарын дайындау және талдау, визуализация құру, заңдылықтарды анықтау және машиналық оқыту модельдерін құруға деректерді дайындау дағдыларын меңгереді.

Кредиттер саны: 6

Пререквизиты:

  • Ақпараттық-коммуникациялық технологиялар
  • Ақпараттық-коммуникациялық технологиялар (ағылшын тілінде)

Пәннің еңбек сыйымдылығы:

Жұмыс түрлері сағат
Дәрістер 15
Практикалық жұмыстар 45
Зертханалық жұмыстар
СӨЖО 30
СӨЖ 90
Қорытынды бақылау нысаны емтихан
Қорытынды бақылауды жүргізу нысаны

Компонент: Таңдау бойынша компонент

Цикл: Базалық пәндер

Мақсат
  • Білім алушыларда Data Science саласы бойынша базалық құзыреттерді қалыптастыру: деректердің өмірлік циклін, оларды талдау әдістерін түсіну және қолданбалы міндеттерді шешуде DS құралдарын қолдану.
Міндет
  • Data Science үдерісінің негізгі ұғымдары мен кезеңдерін зерделеу;
  • деректерді жинау, тазалау және алдын ала өңдеу әдістерін меңгеру;
  • деректерді барлау және статистикалық талдау негіздерін игеру;
  • машиналық оқытудың базалық әдістерін (жіктеу, регрессия) үйрену;
  • Python және DS кітапханаларын деректерді талдау, визуализациялау және модельдеуге дайындау үшін қолдану.
Оқыту нәтижесі: білу және түсіну
  • тиісті ғылыми зерттеулер бойынша қорытындыларды қалыптастыру үшін қажетті заманауи ғылыми зерттеулердің деректерін жинау, өңдеу және түсіндіру процестерін түсіну
Оқыту нәтижесі: білім мен ұғымды қолдану
  • Нақты деректер жиынтықтарында деректерді тазалау және өңдеу әдістерін қолданады.
  • Негізгі регрессия және классификация модельдерін құрады.
  • Деректерді визуализациялап, талдау нәтижелерін көрсетеді.
Оқыту нәтижесі: талқылай білуді қалыптастыру
  • Модель нәтижелерін талдайды және дәлдігін бағалайды.
  • Статистикалық тесттер мен визуализацияларға сүйене отырып қорытынды жасайды.
  • Белгілі бір тапсырма үшін деректерді өңдеудің дұрыс әдістерін анықтайды.
Оқыту нәтижесі: коммуникативтік қабілеттіліктер
  • Оқушылардың коммуникативтік қабілеттерін дамыту және жетілдіру.
  • Практикалық шешімдер қабылдау процесін қолдау үшін саясаттану әдістерін қолдана отырып, саясат саласындағы құбылыстар мен процестерді қолданбалы талдау бойынша конструктивті диалогқа қатысу дағдыларын дамыту.
Оқыту нәтижесі: Оқу дағдылары немесе сабаққа қабілеттілігі
  • Ғылыми-зерттеу жұмыстарын орындау үшін жасанды интеллект жүйесі саласында дағдыларды қалыптастыру
  • Білім қоғамын құру мүддесі үшін академиялық және кәсіби контексттерде технологиялық, әлеуметтік немесе мәдени дамуға үлес қосу мүмкіндігі
  • Тиісті ғылыми зерттеулер бойынша қорытындыларды қалыптастыру үшін қажетті заманауи ғылыми зерттеулердің деректерін жинау, өңдеу және түсіндіру мүмкіндігі
Негізгі әдебиет
  • Миркин Б. Г. Введение в анализ данных. — М.: Юрайт. 2020. 175 с.
  • Нархид Н. Apache Kafka. Потоковая обработка и анализ данных / Н. Нархид. — СПб.: Питер, 2019. — 320 c.
  • Макшанов А.В. Технологии интеллектуального анализа данных. — М.: Лань. 2019. 212 с.
  • Чашкин, Ю.Р. Математическая статистика. Анализ и обработка данных: Учебное пособие / Ю.Р. Чашкин; Под ред. С.Н. Смоленский. — Рн/Д: Феникс, 2021. — 236 c.
  • Дэви Силен, Арно Мейсман, Мохамед Али, Основы Data Science и Big Data. Python и наука о данных. — СПб.: Питер, 2021. — 336 с
  • Юре Лесковец, Ананд Раджараман, Джеффри Д. Ульман, Анализ больших наборов данных. — М.: ДМК Пресс, 2021. — 498 с.)
Қосымша әдебиеттер
  • Рафалович В. Data mining, или интеллектуальный анализ данных для занятых. Практический курс / В. Рафалович. — М.: SmartBook, 2018. — 352 c.
  • Форман Дж. Много цифр: Анализ больших данных при помощи Excel / Дж. Форман. — М.: Альпина Паблишер, 2019. — 461 c.