AI vytěžování dokumentů: GPT Vision [Robert Haken, Vzdělávací okénko, 11.9.2025]

Záznam ze Vzdělávacího okénka HAVIT z 11. září 2025, kde jsem ukazoval specificky techniku vytěžování s pomocí GPT-4o Vision (vstup ve formě bitmapových obrázků přímo předávaných LLM, bez mezipřistání v Markdown).

Co se dozvíte:

  • GPT Vision vs. Markdown přístup – kdy který použít a jaké jsou trade-offs
  • Resizing obrázků na straně klienta před odesláním do GPT (limit 2048×768 px)
  • C# implementace: JSON schéma pro přesnou extrakci strukturovaných dat
  • Multimodální vstup v .NET SDK – předávání image content parts
  • Reálné výsledky na lékařských zprávách a ukázka edge cases

Napsat komentář