Category Archives: Azure

Vytěžování dokumentů – Azure AI Content Understanding [Robert Haken, Vzdělávací okénko 25.9.2025]

Záznam ze Vzdělávacího okénka HAVIT z 25. září 2025, kde jsem ukazoval třetí způsob AI-vytěžování dokumentů – prostřednictvím all-in-one cloudové služby Azure AI Content Understanding.

V předchozích dílech série jsme si ukázali dva přístupy k vytěžování dokumentů pomocí AI: konverzi do Markdown přes Azure Document Intelligence s následným zpracováním přes LLM a přímé zpracování bitmapových obrázků přes GPT-4o Vision. Tentokrát jsme se podívali na třetí cestu – Azure AI Content Understanding, která celý pipeline (OCR, analýza struktury, extrakce dat) zapouzdřuje do jedné cloudové služby.

Co se dozvíte

  • Co je Azure AI Content Understanding a čím se liší od Azure Document Intelligence
  • Jak službu nastavit a nakonfigurovat v Azure portálu
  • Praktická ukázka volání REST API z C#
  • Porovnání všech tří přístupů k AI-vytěžování dokumentů

AI vytěžování dokumentů: GPT Vision [Robert Haken, Vzdělávací okénko, 11.9.2025]

Záznam ze Vzdělávacího okénka HAVIT z 11. září 2025, kde jsem ukazoval specificky techniku vytěžování s pomocí GPT-4o Vision (vstup ve formě bitmapových obrázků přímo předávaných LLM, bez mezipřistání v Markdown).

Co se dozvíte:

  • GPT Vision vs. Markdown přístup – kdy který použít a jaké jsou trade-offs
  • Resizing obrázků na straně klienta před odesláním do GPT (limit 2048×768 px)
  • C# implementace: JSON schéma pro přesnou extrakci strukturovaných dat
  • Multimodální vstup v .NET SDK – předávání image content parts
  • Reálné výsledky na lékařských zprávách a ukázka edge cases

AI vytěžování dokumentů s OpenAI GPT [Vzdělávací okénko, 12.6.2025]

Záznam ze Vzdělávacího okénka HAVIT z 12. června 2025.
Ukázka implementace (POC) vytěžování dokumentů pomocí moderních AI technik. Kombinace Azure Document Intelligence (s výstupem do Markdown) a LLM (OpenAI GPT-4o) pro efektivní vytěžování netriviálních dokumentů (zde přijatých faktur i s energetickými přílohami).

O čem přednáška je

Potřebujete z naskenovaných nebo PDF dokumentů dostat strukturovaná data? Tradiční OCR systémy (Kofax, EFlow, starší Azure Forms Recognizer) vyžadují trénování na konkrétních layoutech a ruční definici cílových polí. V této přednášce ukazuji modernější přístup – kombinaci dvou AI služeb, která zvládne i netriviální dokumenty bez předchozího trénování.

Azure Document Intelligence – konverze do Markdown

Prvním krokem je převod vstupního dokumentu (PDF, sken, fotografie) do strojově čitelné podoby. Azure Document Intelligence analyzuje layout dokumentu a výstupem je Markdown – čistý text se zachovanou strukturou tabulek, nadpisů a odstavců. Oproti klasickému OCR výstupu je Markdown ideálním vstupem pro LLM, protože zachovává kontext a vztahy mezi údaji.

OpenAI GPT-4o – extrakce strukturovaných dat

Markdown výstup z Document Intelligence předáváme OpenAI GPT-4o s promptem, který definuje cílovou strukturu JSON výstupu. Model díky function calling vrací přesně typovaný JSON se všemi požadovanými poli – číslo faktury, datum, dodavatel, položky, částky, měrné jednotky a další technické údaje.

Energetické faktury jako netriviální use case

Ukázka pracuje s reálným scénářem zákazníka – vytěžování přijatých energetických faktur. Tyto dokumenty obsahují desítky položek s různými měrnými jednotkami (kWh, MW, Kč/MWh), technické údaje jako činná a jalová složka, distribuční poplatky, rezervované kapacity a smluvní hodnoty. Výstupní JSON se zapisuje přes REST API do cílového systému, kde se jednotlivé řádky mapují na specifická pole včetně netypických zápisů (např. nulová jednotková cena pro technické údaje).

Implementace v .NET

Celý POC je implementován v C# / .NET s využitím Azure SDK pro Document Intelligence a OpenAI SDK pro komunikaci s GPT-4o. Přednáška zahrnuje praktické ukázky kódu, prompt engineering pro strukturovaný výstup a tipy pro nasazení v produkčním prostředí.

Azure Entra ID – Conditional Access Policies [Dan Hrubý, HAVIT Vzdělávací okénko, 26.9.2024]

Záznam ze Vzdělávacího okénka HAVIT z 26. září 2024, kde Daniel Hrubý povídal o Microsoft Azure Entra ID a aspektech jako MFA, Conditional Access Policies, B2B Collaboration atp.

Azure Spot Instances – záznam [Jiří Činčura, Global Azure Prague 2024]

Záznam z přednášky pro konferenci Global Azure Prague 2024, kde Jiří Činčura ukazoval možnosti úspor nákladů při využití Azure Spot Instances..

Azure AI Search – záznam [Jiří Kanda, Global Azure Praha 2024]

Záznam z přednášky pro konferenci Global Azure Praha, kterou jsem pořádal společně s Davidem Gešvindrem a Tomášem Hercegem 19. dubna 2024.

Azure App Configuration a Azure KeyVault – záznam [Ondřej Václavek, Global Azure Prague 2024]

Záznam z přednášky pro konferenci Global Azure Prague 2024, kde Ondřej Václavek ukazoval možnosti služeb pro konfiguraci aplikací.

Azure OpenAI chat (Global Azure Keynote) – záznam a demo [Robert Haken, Global Azure Praha 05/2023]

V pátek 12. května jsme společně s Davidem Gešvindrem (WUG) a Tomášem Hercegem (Update Conference) pořádali v pražském Microsoftu lokální běh celosvětové konference Global Azure.

Záznam z keynote, kde jsem v podstatě celou dobu mluvil o Azure OpenAI a vytváření chatbota v ChatGPT.

Chatbota si můžete vyzkoušet na chat.havit.cz.

Demo samotné najdete tradičně na GitHub: github.com/havit/HavitOpenAIChatPOC

Pokud máte zájem o něco podobného, ať už od nás naprogramovat, nebo jako pomoc vašemu IT týmu, ozvěte se nám havit.cz/kontakty.

Základní Azure PaaS služby [Jiří Kanda, Vzdělávací okénko, 29.3.2023]

Záznam ze Vzdělávacího okénka HAVIT, kde Jirka Kanda ukazoval, jak v HAVITu používáme platformní služby Azure pro hosting aplikací.

Slides

WebTests [Ondřej Václavek, Vzdělávací okénko, 30.6.2021]

Záznam ze Vzdělávacího okénka HAVIT, kde Ondra Václavek povídal o WebTests v Azure a ve Visual Studiu.