Finetune Lora Qwen3vl и прочие приключения
Компания Домклик представила кейс по дообучению мультимодальной языковой модели (LVLM) Qwen3-VL-2B-Instruct. Целью стало автоматизированное извлечение 15 типов информации из 6 тысяч многостраничных юридических PDF-документов, с распределением данных по всему тексту.
Для адаптации модели применялся метод LoRA (Low-Rank Adaptation). В ходе работы оптимизировались подготовка датасета и подбор параметров обучения, включая выбор слоев модели и учет доступных ресурсов GPU.
💡 В чем бизнес-ценность?
Подход демонстрирует потенциал автоматизации обработки больших объемов неструктурированных документов. Это позволяет повысить скорость и точность извлечения критически важных данных, снизить операционные издержки и минимизировать человеческий фактор в процессах анализа юридической и технической документации. 🏗️
Первоисточник
Читать оригинал