К ленте

Finetune Lora Qwen3vl и прочие приключения

Хабр — Все 09.06.2026 NEWS
Компания Домклик представила кейс по дообучению мультимодальной языковой модели (LVLM) Qwen3-VL-2B-Instruct. Целью стало автоматизированное извлечение 15 типов информации из 6 тысяч многостраничных юридических PDF-документов, с распределением данных по всему тексту. Для адаптации модели применялся метод LoRA (Low-Rank Adaptation). В ходе работы оптимизировались подготовка датасета и подбор параметров обучения, включая выбор слоев модели и учет доступных ресурсов GPU. 💡 В чем бизнес-ценность? Подход демонстрирует потенциал автоматизации обработки больших объемов неструктурированных документов. Это позволяет повысить скорость и точность извлечения критически важных данных, снизить операционные издержки и минимизировать человеческий фактор в процессах анализа юридической и технической документации. 🏗️

Первоисточник

Читать оригинал