На семинаре вы узнаете как быстро ответить на вопрос: “А есть ли внешние источники данных, фичи из которых существенно улучшают качество моей ML модели?” Вы удивитесь, но оказывается, поиск данных для ML алгоритмов гораздо проще делать не в Google, Yandex или Github, пытаясь сформулировать запрос на естественном языке, а использовать готовый эталон с разметкой. Эксперты Upgini расскажут как быстро и легко находить релевантные фичи из сотен общедоступных и закрытых источников данных, оптимизированных с помощью нейронных сетей и LLM. Ведь LLM — это по сути база слабоструктурированных данных, сжатая алгоритмом сжатия с потерями, с которой можно и нужно разговаривать для извлечения информации. И все это будет рассмотрено на двух реальных и очень распространённых примерах бизнес задач на базе DS/ML: ▫️ Определение фрода в Fintech сервисах; ▫️ Предсказание спроса для ритейла и E-com.