Больше информации по резюме будет доступно после регистрации

Зарегистрироваться
Был сегодня в 10:25

Мужчина

Алматы, не готов к переезду, не готов к командировкам

AI / ML Engineer

Специализации:
  • Аналитик
  • Программист, разработчик

Тип занятости: полная занятость

Опыт работы 6 лет 6 месяцев

Февраль 2025по настоящее время
1 год 3 месяца

Казахстан

Общественная деятельность, партии, благотворительность, НКО... Показать еще

Lead of Data Science
★ Руководство командой аналитиков в разработке решений на основе данных для инициатив городского планирования. ★ Возглавил проект прогнозирования населения Алматы до 2030 года с интеграцией анализа пространственного распределения для поддержки стратегий развития города. ★ Разработал микросервисную систему промышленного уровня (8 сервисов) для NL2SQL с LLM-управляемым мультиагентным RAG-конвейером, обрабатывающим 900+ таблиц базы данных: Создал машину состояний LangGraph с 8-узловым конвейером генерации SQL и структурированным выводом Pydantic: поиск (4 узла) → ранжирование (1 узел) → генерация SQL (1 узел) → коррекция значений (1 узел) → валидация (1 узел), реализовал автоматическую логику повторных попыток и гибридный поиск, сочетающий семантический поиск pgvector с переранжированием LLM. Разработал агентное RAG-ядро с архитектурой вызова инструментов (генерация SQL, выполнение, визуализация, резервные варианты) с использованием vLLM (Qwen3-30B), реализовал декомпозицию запросов с параллельным выполнением подзадач и интеллектуальный prompt engineering с few-shot примерами. Создал двойной интерфейс с Telegram-ботом (Aiogram 3.x) + FastAPI REST API с общим бэкендом, интегрировал менеджер разговоров на базе Redis с контекстно-зависимым переформулированием запросов через vLLM, Markdown-форматирование и автоматическую обработку изображений/документов. Разработал движок визуализации с сервисом выполнения Python-кода, сгенерированного LLM, для интерактивных карт (Folium) и графиков (Matplotlib), поддержка пространственного анализа (Shapely: буферы, расстояния, пересечения) с асинхронной обработкой задач. Спроектировал и наполнил инфраструктуру базы знаний с комплексной базой метаданных, описывающей 900+ таблиц и их столбцов, включая эмбеддинги для семантического поиска, интегрировал pgvector для интеллектуального обнаружения таблиц/столбцов, создал сервис управления метаданными, предоставляющий связи таблиц, условия JOIN и статистику столбцов для LLM-управляемой генерации SQL. Контейнеризировал 8 микросервисов с помощью Docker. Реализовал GitLab CI/CD конвейер (сборка → развертывание → очистка) с тегированием SHA коммитов и возможностью автоматического отката. Стек: Python, FastAPI, LangGraph, vLLM, Aiogram, pgvector, Redis, PostgreSQL, PostGIS, SQLAlchemy, Pydantic, Docker, GitLab CI/CD, Ollama, Shapely, Folium.
Сентябрь 2023по настоящее время
2 года 8 месяцев

Алматы

Общественная деятельность, партии, благотворительность, НКО... Показать еще

Data Engineer \ Data Analyst
★ Автоматизировал сбор данных с использованием Python и Docker, оптимизируя доступ к критическим городским показателям. ★ Разработал дашборды Power BI для визуализации данных о трафике, преступности и налогах, улучшая процессы принятия решений. ★ Разработал многоступенчатый LLM-конвейер для ответов на вопросы о городских данных со специализированной оркестрацией цепочек: Спроектировал последовательную архитектуру из 4 цепочек с ролевым распределением задач с использованием LangChain LCEL: (1) LLM-классификатор вопросов (llama3.2) с few-shot обучением на 23 примерах для категоризации пользовательских запросов по 10 таблицам городских метрик (преступления, школы, детские сады, пожары, экстренные вызовы, полицейские участки, эвакуационные пункты, спортивные объекты, ремонтные работы) или отклонения нерелевантных вопросов, (2) генератор SQL (gemma3:27b) с внедрением схемы и few-shot обучением для преобразования естественного языка в SQL, (3) валидатор SQL (gemma3:27b), обеспечивающий доработку запросов на основе ошибок с автоматическим механизмом повторных попыток при неудачном первоначальном выполнении, (4) синтезатор ответов (llama3.2), генерирующий отформатированные ответы на русском языке с Markdown-стилизацией, скрывая технические детали реализации. Создал асинхронную архитектуру с FastAPI + Telegram-ботом aiogram с inline-клавиатурами, обменом геолокацией и ReplyKeyboardMarkup для геопозиционирования. Интегрировал PostgreSQL с асинхронной ORM SQLAlchemy (драйвер asyncpg), выполняющей запросы к 10+ таблицам городских метрик с запланированным обновлением метаданных (APScheduler), обновляя схемы таблиц и эмбеддинги каждую минуту. Реализовал многоуровневую обработку ошибок с корректным возвратом пользовательских сообщений для невалидных запросов. Стек: Python, FastAPI, LangChain, Ollama, aiogram, asyncpg, SQLAlchemy, APScheduler, PyTorch. ★ Провел NLP-анализ отзывов граждан для оценки и улучшения качества государственных услуг.
Январь 2023по настоящее время
3 года 4 месяца
Freelance
Freelance Developer
★ Разработал пользовательский чатбот для продажи автозапчастей с использованием ChatGPT API, улучшив вовлечение клиентов и эффективность продаж. ★ Разработал RAG-систему промышленного уровня с интеллектуальным конвейером поиска документов. Создал асинхронный бэкенд на FastAPI с модульной архитектурой маршрутизаторов. Реализовал многоступенчатый RAG-конвейер. Парсинг документов в разных форматах (pdfminer + Tesseract OCR для отсканированных документов) с дедупликацией по хешу. Интеллектуальное разбиение на чанки (сегменты по 96 слов с перекрытием), генерация контекстуализированных эмбеддингов через Qwen3-Embedding. Гибридный поиск, сочетающий семантический поиск pgvector и нечеткое сопоставление (rapidfuzz). Разработал LLM-агент с вызовом инструментов (валидация Pydantic) для автономной маршрутизации запросов к группам файлов или содержимому файлов. Интегрировал API Ollama для локального вывода LLM (Qwen3:14b) с перефразированием запросов. Создал систему разговоров с сохранением состояния с кешированием Redis. Реализовал схему PostgreSQL + pgvector с асинхронной ORM SQLAlchemy (3 таблицы: файлы с эмбеддингами сводок, чанки с контекстуализированными эмбеддингами, история чата с JSONB-контекстом). Развернул запланированный парсер документов (APScheduler с блокировкой файлов для многопроцессорной безопасности) и отзывчивый веб-интерфейс (HTML/CSS/JS с рендерингом Markdown). Стек: Python, FastAPI, Ollama, pgvector, Redis, PostgreSQL, SQLAlchemy, Pydantic, Alembic (миграции), pdf2image, Tesseract, tiktoken, rapidfuzz. ★ Участие в стартапе по распознаванию позы для виртуальной примерки обуви (YOLO) в качестве AI ML Лида.
Ноябрь 2022Август 2023
10 месяцев
Международная школа AQBOBEK

Актобе

Инженер по автоматизации
★ Разработка веб сервиса для сбора показателей с IoT датчиков ★ Настройка системы мониторинга Grafana ★ Работа с сенсорами, и электронными схемами ★ Написание программы для wifi микроконтроллеров NodeMCU v1.0 на базе ESP8266
Август 2022Август 2023
1 год 1 месяц
ТОО Байнур и П

Актобе

Телекоммуникации, связь... Показать еще

Python/Django Backrend Developer
★ Backend для системы тех. учёта элементов сети на Django ★ Настройка архитектуры базы данных PostgreSQL ★ Подключения плагина карты Leaflet OpenStreetMap
Август 2018Декабрь 2020
2 года 5 месяцев
TOO Bauten

Алматы, bauten.kz

Автомобильный бизнес... Показать еще

Программист-разработчик
★ Executed web scraping projects with Python and developed an anti-captcha autoencoder using TensorFlow. ★ Built an Android mobile app for warehouse management.
Январь 2018Апрель 2018
4 месяца
Suleiman Demirel University Bachelor Students
Ментор
★ Руководил студентами в создании среды Unity и обучении моделей CNN для проекта беспилотного автомобиля. ★ Проекты: Беспилотный персонаж, Беспилотный автомобиль.

Навыки

Уровни владения навыками
Продвинутый уровень
Python
SQL
Аналитика
Средний уровень
PostgreSQL
Уровень не указан
Data Science
Машинное обучение
Data Analysis
ETL
ML
Docker
FastAPI
Django
Ollama
LLM
TensorFlow
PyTorch
YOLO
pgVector
vLLM
SQLAlchemy
Pydantic
Tesseract
Redis
GitLab CI/CD
LangGraph
LangChain

Обо мне

интересуюсь квантовой физикой и геополитикой

Высшее образование (Магистр)

2016
Высшее образование (Магистр)
кафедра «Компьютерная инженерия и телекоммуникация», Вычислительная техника и программное обеспечение
2014
Высшее образование (Магистр)
кафедра «Компьютерная инженерия и телекоммуникация», Вычислительная техника и программное обеспечение

Знание языков

Казахский — Родной

Английский — C1 — Продвинутый

Русский — C2 — В совершенстве

Повышение квалификации, курсы

2022
Data Science
Able Academy
2018
deeplearning.ai
coursera.org, Convolutional Neural Networks
2018
deeplearning.ai
coursera.org, Sequence Models
2017
deeplearning.ai
coursera.org, Neural Networks and Deep Learning
2017
deeplearning.ai
coursera.org, Improving Deep Neural Networks: Hyperparameter tuning, Regularization and Optimization
2017
deeplearning.ai
coursera.org, Structuring Machine Learning Projects
2016
Stanford University, Andrew Ng.
coursera.org, Machine Learning

Гражданство, время в пути до работы

Гражданство: Казахстан

Разрешение на работу: Другое, Казахстан

Желательное время в пути до работы: Не имеет значения