Data Science негіздері
Сипаттама: Пән деректер ғылымының негізгі ұғымдары мен деректермен жұмыс істеудің негізгі кезеңдері туралы базалық түсінік қалыптастырады: деректерді жинау, алдын ала өңдеу, талдау, визуализациялау және нәтижелерді интерпретациялау. Python тілін деректерді талдау үшін қолданудың негіздері, Jupyter Notebook ортасында жұмыс істеу, NumPy, pandas, matplotlib, seaborn кітапханалары, сондай-ақ статистикалық талдау мен машиналық оқытудың бастапқы әдістері қарастырылады. Студенттер деректер жиынтықтарын дайындау және талдау, визуализация құру, заңдылықтарды анықтау және машиналық оқыту модельдерін құруға деректерді дайындау дағдыларын меңгереді.
Кредиттер саны: 6
Пререквизиты:
- Ақпараттық-коммуникациялық технологиялар
- Ақпараттық-коммуникациялық технологиялар (ағылшын тілінде)
Пәннің еңбек сыйымдылығы:
| Жұмыс түрлері | сағат |
|---|---|
| Дәрістер | 15 |
| Практикалық жұмыстар | 45 |
| Зертханалық жұмыстар | |
| СӨЖО | 30 |
| СӨЖ | 90 |
| Қорытынды бақылау нысаны | емтихан |
| Қорытынды бақылауды жүргізу нысаны |
Компонент: Таңдау бойынша компонент
Цикл: Базалық пәндер
Мақсат
- Білім алушыларда Data Science саласы бойынша базалық құзыреттерді қалыптастыру: деректердің өмірлік циклін, оларды талдау әдістерін түсіну және қолданбалы міндеттерді шешуде DS құралдарын қолдану.
Міндет
- Data Science үдерісінің негізгі ұғымдары мен кезеңдерін зерделеу;
- деректерді жинау, тазалау және алдын ала өңдеу әдістерін меңгеру;
- деректерді барлау және статистикалық талдау негіздерін игеру;
- машиналық оқытудың базалық әдістерін (жіктеу, регрессия) үйрену;
- Python және DS кітапханаларын деректерді талдау, визуализациялау және модельдеуге дайындау үшін қолдану.
Оқыту нәтижесі: білу және түсіну
- тиісті ғылыми зерттеулер бойынша қорытындыларды қалыптастыру үшін қажетті заманауи ғылыми зерттеулердің деректерін жинау, өңдеу және түсіндіру процестерін түсіну
Оқыту нәтижесі: білім мен ұғымды қолдану
- Нақты деректер жиынтықтарында деректерді тазалау және өңдеу әдістерін қолданады.
- Негізгі регрессия және классификация модельдерін құрады.
- Деректерді визуализациялап, талдау нәтижелерін көрсетеді.
Оқыту нәтижесі: талқылай білуді қалыптастыру
- Модель нәтижелерін талдайды және дәлдігін бағалайды.
- Статистикалық тесттер мен визуализацияларға сүйене отырып қорытынды жасайды.
- Белгілі бір тапсырма үшін деректерді өңдеудің дұрыс әдістерін анықтайды.
Оқыту нәтижесі: коммуникативтік қабілеттіліктер
- Оқушылардың коммуникативтік қабілеттерін дамыту және жетілдіру.
- Практикалық шешімдер қабылдау процесін қолдау үшін саясаттану әдістерін қолдана отырып, саясат саласындағы құбылыстар мен процестерді қолданбалы талдау бойынша конструктивті диалогқа қатысу дағдыларын дамыту.
Оқыту нәтижесі: Оқу дағдылары немесе сабаққа қабілеттілігі
- Ғылыми-зерттеу жұмыстарын орындау үшін жасанды интеллект жүйесі саласында дағдыларды қалыптастыру
- Білім қоғамын құру мүддесі үшін академиялық және кәсіби контексттерде технологиялық, әлеуметтік немесе мәдени дамуға үлес қосу мүмкіндігі
- Тиісті ғылыми зерттеулер бойынша қорытындыларды қалыптастыру үшін қажетті заманауи ғылыми зерттеулердің деректерін жинау, өңдеу және түсіндіру мүмкіндігі
Негізгі әдебиет
- Миркин Б. Г. Введение в анализ данных. — М.: Юрайт. 2020. 175 с.
- Нархид Н. Apache Kafka. Потоковая обработка и анализ данных / Н. Нархид. — СПб.: Питер, 2019. — 320 c.
- Макшанов А.В. Технологии интеллектуального анализа данных. — М.: Лань. 2019. 212 с.
- Чашкин, Ю.Р. Математическая статистика. Анализ и обработка данных: Учебное пособие / Ю.Р. Чашкин; Под ред. С.Н. Смоленский. — Рн/Д: Феникс, 2021. — 236 c.
- Дэви Силен, Арно Мейсман, Мохамед Али, Основы Data Science и Big Data. Python и наука о данных. — СПб.: Питер, 2021. — 336 с
- Юре Лесковец, Ананд Раджараман, Джеффри Д. Ульман, Анализ больших наборов данных. — М.: ДМК Пресс, 2021. — 498 с.)
Қосымша әдебиеттер
- Рафалович В. Data mining, или интеллектуальный анализ данных для занятых. Практический курс / В. Рафалович. — М.: SmartBook, 2018. — 352 c.
- Форман Дж. Много цифр: Анализ больших данных при помощи Excel / Дж. Форман. — М.: Альпина Паблишер, 2019. — 461 c.