Το περιεχόμενο παρέχεται από το VTB Bank. Όλο το περιεχόμενο podcast, συμπεριλαμβανομένων των επεισοδίων, των γραφικών και των περιγραφών podcast, μεταφορτώνεται και παρέχεται απευθείας από τον VTB Bank ή τον συνεργάτη της πλατφόρμας podcast. Εάν πιστεύετε ότι κάποιος χρησιμοποιεί το έργο σας που προστατεύεται από πνευματικά δικαιώματα χωρίς την άδειά σας, μπορείτε να ακολουθήσετε τη διαδικασία που περιγράφεται εδώ https://el.player.fm/legal.

People love us!

User reviews

'Αγαπώ τη λειτουργίας εκτός σύνδεσης'
'Αυτός είναι ο' τρόπος για να χειριστείτε τις συνδρομές σας podcast. Είναι επίσης ένας πολύ καλός τρόπος για να ανακαλύψετε νέα podcasts '.

MLOps, часть II: погружаемся в специфику работы с данными

1:19:09
 
Μοίρασέ το
 

Manage episode 377095778 series 2948420
Το περιεχόμενο παρέχεται από το VTB Bank. Όλο το περιεχόμενο podcast, συμπεριλαμβανομένων των επεισοδίων, των γραφικών και των περιγραφών podcast, μεταφορτώνεται και παρέχεται απευθείας από τον VTB Bank ή τον συνεργάτη της πλατφόρμας podcast. Εάν πιστεύετε ότι κάποιος χρησιμοποιεί το έργο σας που προστατεύεται από πνευματικά δικαιώματα χωρίς την άδειά σας, μπορείτε να ακολουθήσετε τη διαδικασία που περιγράφεται εδώ https://el.player.fm/legal.

Во второй части большой темы про MLOps, которую мы разбили на несколько эпизодов подкаста, ещё глубже погружаемся в тему машинного обучения и работы с данными, лежащей в основе ML. Рассматриваем вопросы обогащения данных, разбираемся с разметкой, говорим о специфических аспектах управления данными.

В этом выпуске вы услышите:

Почему общепринятых стандартов управления данными недостаточно для работы с большими данными для ML;

Что такое хвосты и артефакты в сверхбольших данных;

Может ли overfeeding стать причиной overfitting’a (или это одно и то же?);

И многое другое!

Юрий Карев, руководитель управления процессов и стандартов моделирования и машинного обучения ВТБ, и Алексей Незнанов, к.т.н, старший научный сотрудник международной лаборатории интеллектуальных систем и структурного анализа НИУ ВШЭ, подошли к теме с двух сторон: теоретической и практической. Помогли ведущей подкаста разобраться с терминологией. А также поговорили про специфику подходов к образованию для специалистов в Data Science, DataOps и MLOps.

Полезные ресурсы и ссылки:

Курс MLOps (OTUS): https://otus.ru/lessons/ml-bigdata/

Основные идеи из книги «Сотрудничество в DevOps-культуре»: http://agilemindset.ru/основные-идеи-из-книги-сотрудничест/

MLOps: Continuous delivery and automation pipelines in machine learning: https://cloud.google.com/architecture/mlops-continuous-delivery-and-automation-pipelines-in-machine-learning

Как создавать качественные ML-системы. Часть 1: каждый проект должен начинаться с плана: https://habr.com/ru/companies/vk/articles/749850/

Как создавать качественные ML-системы. Часть 2: приручаем хаос: https://habr.com/ru/companies/vk/articles/749852/

The Data Engineering Cookbook: https://github.com/andkret/Cookbook

Стандарты:

ISO/IEC DIS 5259-1: https://www.iso.org/standard/81088.html

ISO/IEC DIS 5259-4: https://www.iso.org/standard/81093.html

ISO/IEC 8183:2023: https://www.iso.org/standard/83002.html

  continue reading

46 επεισόδια

iconΜοίρασέ το
 
Manage episode 377095778 series 2948420
Το περιεχόμενο παρέχεται από το VTB Bank. Όλο το περιεχόμενο podcast, συμπεριλαμβανομένων των επεισοδίων, των γραφικών και των περιγραφών podcast, μεταφορτώνεται και παρέχεται απευθείας από τον VTB Bank ή τον συνεργάτη της πλατφόρμας podcast. Εάν πιστεύετε ότι κάποιος χρησιμοποιεί το έργο σας που προστατεύεται από πνευματικά δικαιώματα χωρίς την άδειά σας, μπορείτε να ακολουθήσετε τη διαδικασία που περιγράφεται εδώ https://el.player.fm/legal.

Во второй части большой темы про MLOps, которую мы разбили на несколько эпизодов подкаста, ещё глубже погружаемся в тему машинного обучения и работы с данными, лежащей в основе ML. Рассматриваем вопросы обогащения данных, разбираемся с разметкой, говорим о специфических аспектах управления данными.

В этом выпуске вы услышите:

Почему общепринятых стандартов управления данными недостаточно для работы с большими данными для ML;

Что такое хвосты и артефакты в сверхбольших данных;

Может ли overfeeding стать причиной overfitting’a (или это одно и то же?);

И многое другое!

Юрий Карев, руководитель управления процессов и стандартов моделирования и машинного обучения ВТБ, и Алексей Незнанов, к.т.н, старший научный сотрудник международной лаборатории интеллектуальных систем и структурного анализа НИУ ВШЭ, подошли к теме с двух сторон: теоретической и практической. Помогли ведущей подкаста разобраться с терминологией. А также поговорили про специфику подходов к образованию для специалистов в Data Science, DataOps и MLOps.

Полезные ресурсы и ссылки:

Курс MLOps (OTUS): https://otus.ru/lessons/ml-bigdata/

Основные идеи из книги «Сотрудничество в DevOps-культуре»: http://agilemindset.ru/основные-идеи-из-книги-сотрудничест/

MLOps: Continuous delivery and automation pipelines in machine learning: https://cloud.google.com/architecture/mlops-continuous-delivery-and-automation-pipelines-in-machine-learning

Как создавать качественные ML-системы. Часть 1: каждый проект должен начинаться с плана: https://habr.com/ru/companies/vk/articles/749850/

Как создавать качественные ML-системы. Часть 2: приручаем хаос: https://habr.com/ru/companies/vk/articles/749852/

The Data Engineering Cookbook: https://github.com/andkret/Cookbook

Стандарты:

ISO/IEC DIS 5259-1: https://www.iso.org/standard/81088.html

ISO/IEC DIS 5259-4: https://www.iso.org/standard/81093.html

ISO/IEC 8183:2023: https://www.iso.org/standard/83002.html

  continue reading

46 επεισόδια

Όλα τα επεισόδια

×
 
Loading …

Καλώς ήλθατε στο Player FM!

Το FM Player σαρώνει τον ιστό για podcasts υψηλής ποιότητας για να απολαύσετε αυτή τη στιγμή. Είναι η καλύτερη εφαρμογή podcast και λειτουργεί σε Android, iPhone και στον ιστό. Εγγραφή για συγχρονισμό συνδρομών σε όλες τις συσκευές.

 

Player FM - Εφαρμογή podcast
Πηγαίνετε εκτός σύνδεσης με την εφαρμογή Player FM !

Οδηγός γρήγορης αναφοράς