Author Archives: Robert Haken

About Robert Haken

Software Architect, Founder at HAVIT, Microsoft MVP - ASP.NET/IIS

Blazor – EditForm a submit tlačítko mimo něj [Vzdělávací okénko, 20.11.2025]

Záznam z (mini) Vzdělávacího okénka HAVIT, kde jsem ukazoval, jak se vypořádat s umístěním submit HxSubmit tlačítka mimo formulář (EditForm).

EF Core 10 [Jiří Kanda, Vzdělávací okénko, 6.11.2025]

Zanechat odpověď

Záznam ze Vzdělávacího okénka HAVIT z 6. listopadu 2025. Jirka nám ukazoval, co je nového v Entity Framework Core 10, co se hodí pro naše projekty a jak nyní funguje IN operátor (Contains()) a jeho bucketizace parametrů.

PDF v .NET pomocí PDFSharp/MigraDoc [T. Wagner, Z. Hlinka, Vzdělávací okénko, 2.10.2025]

Zanechat odpověď

Záznam ze Vzdělávacího okénka z 2. října 2025. Tomáš a Zdeněk ukazovali bezplatné knihovny pro tvorbu PDF z .NET – PDFSharp a jeho nadstavbu MigraDoc.

AI generování obrázků (gpt-image-1) [Gabriela Turcajová, Vzdělávací okénko, 9.10.2025]

Zanechat odpověď

Záznam ze Vzdělávacího okénka HAVIT z 9. října 2025, kde nám Gabriela Turcajová ukazovala použití gpt-image-1 – AI modelu od OpenAI určeného pro generování obrázků. Praktická ukázka se zaměřila na zajímavý use case: generování pravděpodobné podoby dítěte na základě fotografií rodičů.

Model gpt-image-1 představuje novou generaci AI nástrojů pro práci s obrázky. Na rozdíl od starších modelů (jako DALL·E) nabízí výrazně realističtější výstupy a lepší porozumění vstupním instrukcím. Gabriela ukázala, jak model dokáže analyzovat vstupní fotografie a na jejich základě vytvořit nový obrázek kombinující rysy obou osob.

Během přednášky jsme se dozvěděli, jak s modelem pracovat, jaké jsou jeho možnosti i limity, a na co si dát pozor při formulování promptů pro generování obrázků.

Vytěžování dokumentů – Azure AI Content Understanding [Robert Haken, Vzdělávací okénko 25.9.2025]

Zanechat odpověď

Záznam ze Vzdělávacího okénka HAVIT z 25. září 2025, kde jsem ukazoval třetí způsob AI-vytěžování dokumentů – prostřednictvím all-in-one cloudové služby Azure AI Content Understanding.

V předchozích dílech série jsme si ukázali dva přístupy k vytěžování dokumentů pomocí AI: konverzi do Markdown přes Azure Document Intelligence s následným zpracováním přes LLM a přímé zpracování bitmapových obrázků přes GPT-4o Vision. Tentokrát jsme se podívali na třetí cestu – Azure AI Content Understanding, která celý pipeline (OCR, analýza struktury, extrakce dat) zapouzdřuje do jedné cloudové služby.

Co se dozvíte

Co je Azure AI Content Understanding a čím se liší od Azure Document Intelligence
Jak službu nastavit a nakonfigurovat v Azure portálu
Praktická ukázka volání REST API z C#
Porovnání všech tří přístupů k AI-vytěžování dokumentů

AI vytěžování dokumentů: GPT Vision [Robert Haken, Vzdělávací okénko, 11.9.2025]

Zanechat odpověď

Záznam ze Vzdělávacího okénka HAVIT z 11. září 2025, kde jsem ukazoval specificky techniku vytěžování s pomocí GPT-4o Vision (vstup ve formě bitmapových obrázků přímo předávaných LLM, bez mezipřistání v Markdown).

Co se dozvíte:

GPT Vision vs. Markdown přístup – kdy který použít a jaké jsou trade-offs
Resizing obrázků na straně klienta před odesláním do GPT (limit 2048×768 px)
C# implementace: JSON schéma pro přesnou extrakci strukturovaných dat
Multimodální vstup v .NET SDK – předávání image content parts
Reálné výsledky na lékařských zprávách a ukázka edge cases

Novinky v .NET 9 a výhled na .NET 10 – záznam a slides [Robert Haken, WUG Days Brno 9/2025]

Zanechat odpověď

Záznam z přednášky pro konferenci WUG Days Brno z 5.9.2025, kde jsem telegraficky představoval novinky z „.NET 9 vlny“ a pár přicházejících v „.NET 10 vlně“.

Slides

2025-09-05 – WUG Days Brno – Novinky .NET 9 a výhled .NET 10 – slides Download

AI vytěžování dokumentů s OpenAI GPT – Markdown / Vision [WUG Days Brno 09/2025]

Zanechat odpověď

Záznam ze přednášky pro konferenci WUG Days Brno z 4. září 2025.
Ukázka dvou implementací (POC) vytěžování dokumentů pomocí moderních AI technik:

Kombinace Azure Document Intelligence (s výstupem do Markdown) a LLM (OpenAI GPT-4o) pro efektivní vytěžování netriviálních dokumentů (zde přijatých faktur i s energetickými přílohami).
OpenAI GPT-4o v režimu Vision pro vytěžování údajů obrázků (fotografií zdravotních zpráv).

AI vytěžování dokumentů s OpenAI GPT [Vzdělávací okénko, 12.6.2025]

Zanechat odpověď

Záznam ze Vzdělávacího okénka HAVIT z 12. června 2025.
Ukázka implementace (POC) vytěžování dokumentů pomocí moderních AI technik. Kombinace Azure Document Intelligence (s výstupem do Markdown) a LLM (OpenAI GPT-4o) pro efektivní vytěžování netriviálních dokumentů (zde přijatých faktur i s energetickými přílohami).

O čem přednáška je

Potřebujete z naskenovaných nebo PDF dokumentů dostat strukturovaná data? Tradiční OCR systémy (Kofax, EFlow, starší Azure Forms Recognizer) vyžadují trénování na konkrétních layoutech a ruční definici cílových polí. V této přednášce ukazuji modernější přístup – kombinaci dvou AI služeb, která zvládne i netriviální dokumenty bez předchozího trénování.

Azure Document Intelligence – konverze do Markdown

Prvním krokem je převod vstupního dokumentu (PDF, sken, fotografie) do strojově čitelné podoby. Azure Document Intelligence analyzuje layout dokumentu a výstupem je Markdown – čistý text se zachovanou strukturou tabulek, nadpisů a odstavců. Oproti klasickému OCR výstupu je Markdown ideálním vstupem pro LLM, protože zachovává kontext a vztahy mezi údaji.

OpenAI GPT-4o – extrakce strukturovaných dat

Markdown výstup z Document Intelligence předáváme OpenAI GPT-4o s promptem, který definuje cílovou strukturu JSON výstupu. Model díky function calling vrací přesně typovaný JSON se všemi požadovanými poli – číslo faktury, datum, dodavatel, položky, částky, měrné jednotky a další technické údaje.

Energetické faktury jako netriviální use case

Ukázka pracuje s reálným scénářem zákazníka – vytěžování přijatých energetických faktur. Tyto dokumenty obsahují desítky položek s různými měrnými jednotkami (kWh, MW, Kč/MWh), technické údaje jako činná a jalová složka, distribuční poplatky, rezervované kapacity a smluvní hodnoty. Výstupní JSON se zapisuje přes REST API do cílového systému, kde se jednotlivé řádky mapují na specifická pole včetně netypických zápisů (např. nulová jednotková cena pro technické údaje).

Implementace v .NET

Celý POC je implementován v C# / .NET s využitím Azure SDK pro Document Intelligence a OpenAI SDK pro komunikaci s GPT-4o. Přednáška zahrnuje praktické ukázky kódu, prompt engineering pro strukturovaný výstup a tipy pro nasazení v produkčním prostředí.

Blazor performance – záznam a slides [TechEd Praha 2025]

Zanechat odpověď

Záznam z přednášky pro konferenci TechEd Praha 2025, kde jsem ukazoval některé zajímavé aspekty výkonnosti Blazor (WebAssembly) aplikací.

Specifika výkonu Blazor WebAssembly vs. Server — kde jsou skutečná výkonová úzká hrdla
JavaScript interop overhead — proč ho chápat jako inter-process komunikaci
Optimalizace download size — Map Static Assets a fingerprintování v .NET 9
Component lifecycle a change detection — kdy a proč Blazor přerenderuje
Jak zastavit lavinu přerenderování — @key direktiva a správná struktura komponent
Výkonový overhead při velkém počtu komponent (měření Blazor týmu)
Server prerendering pro lepší UX i SEO
WebAssembly profiling v .NET 10 — nativní Browser DevTools profiling (preview)

Slides

2024-05-22 – TechEd Praha – Blazor performance Download

HAVIT Knowledge Base

vývoj software, Microsoft technologie, postřehy, blog

Author Archives: Robert Haken

About Robert Haken

Blazor – EditForm a submit tlačítko mimo něj [Vzdělávací okénko, 20.11.2025]

EF Core 10 [Jiří Kanda, Vzdělávací okénko, 6.11.2025]

PDF v .NET pomocí PDFSharp/MigraDoc [T. Wagner, Z. Hlinka, Vzdělávací okénko, 2.10.2025]

AI generování obrázků (gpt-image-1) [Gabriela Turcajová, Vzdělávací okénko, 9.10.2025]

Vytěžování dokumentů – Azure AI Content Understanding [Robert Haken, Vzdělávací okénko 25.9.2025]

Co se dozvíte

AI vytěžování dokumentů: GPT Vision [Robert Haken, Vzdělávací okénko, 11.9.2025]

Novinky v .NET 9 a výhled na .NET 10 – záznam a slides [Robert Haken, WUG Days Brno 9/2025]

Slides

AI vytěžování dokumentů s OpenAI GPT – Markdown / Vision [WUG Days Brno 09/2025]

AI vytěžování dokumentů s OpenAI GPT [Vzdělávací okénko, 12.6.2025]

O čem přednáška je

Azure Document Intelligence – konverze do Markdown

OpenAI GPT-4o – extrakce strukturovaných dat

Energetické faktury jako netriviální use case

Implementace v .NET

Blazor performance – záznam a slides [TechEd Praha 2025]

Slides

About Robert Haken

Sdílet:

Sdílet:

Sdílet:

Sdílet:

Co se dozvíte

Sdílet:

Sdílet:

Slides

Sdílet:

Sdílet:

O čem přednáška je

Azure Document Intelligence – konverze do Markdown

OpenAI GPT-4o – extrakce strukturovaných dat

Energetické faktury jako netriviální use case

Implementace v .NET

Sdílet:

Slides

Sdílet: