Záznam ze Vzdělávacího okénka HAVIT z 11. září 2025, kde jsem ukazoval specificky techniku vytěžování s pomocí GPT-4o Vision (vstup ve formě bitmapových obrázků přímo předávaných LLM, bez mezipřistání v Markdown).
Co se dozvíte:
- GPT Vision vs. Markdown přístup – kdy který použít a jaké jsou trade-offs
- Resizing obrázků na straně klienta před odesláním do GPT (limit 2048×768 px)
- C# implementace: JSON schéma pro přesnou extrakci strukturovaných dat
- Multimodální vstup v .NET SDK – předávání image content parts
- Reálné výsledky na lékařských zprávách a ukázka edge cases