AI vytěžování dokumentů: GPT Vision [Robert Haken, Vzdělávací okénko, 11.9.2025]

Zanechat odpověď

Záznam ze Vzdělávacího okénka HAVIT z 11. září 2025, kde jsem ukazoval specificky techniku vytěžování s pomocí GPT-4o Vision (vstup ve formě bitmapových obrázků přímo předávaných LLM, bez mezipřistání v Markdown).

Co se dozvíte:

GPT Vision vs. Markdown přístup – kdy který použít a jaké jsou trade-offs
Resizing obrázků na straně klienta před odesláním do GPT (limit 2048×768 px)
C# implementace: JSON schéma pro přesnou extrakci strukturovaných dat
Multimodální vstup v .NET SDK – předávání image content parts
Reálné výsledky na lékařských zprávách a ukázka edge cases

Napsat komentář Zrušit odpověď na komentář