Český stemmer do MSSQL 2008 R2 x64

Dneska se budu s laskavým svolením chlubit cizím peřím, uvádím postup (mnou neověřený, ale z důvěryhodného zdroje – od Roberta Kindla z firmy EXEC), jak do MS SQL 2008 R2 x64 dostat český stemmer pro fultextové vyhledávání:

****

musis nainstalovat Microsoft Search Server 2010 Express – to by melo byt zdarma a cesky stemmer to obsahuje

bohuzel je ale ten stemmer dostupny jen v tom Sharepointu (neregistruje se to do systemu)

takze jsem vlasnimi silami vyhackoval toto:
Windows Registry Editor Version 5.00
[HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10_50.SQL2008R2\MSSearch\Language\ces]
„TsaurusFile“=“tsces.xml“
„Locale“=dword:00000405
„WBreakerClass“=“{468bfc77-3876-4a47-a6ff-f5f6e8ea7968}“
„StemmerClass“=“{f51b7203-9bf9-4c39-b655-18fad8fa8a9a}“
[HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10_50.SQL2008R2\MSSearch\CLSID\{f51b7203-9bf9-4c39-b655-18fad8fa8a9a}]
@=“c:\\Program Files\\Microsoft Office Servers\\14.0\\Bin\\mswb7.dll“
[HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10_50.SQL2008R2\MSSearch\CLSID\{468bfc77-3876-4a47-a6ff-f5f6e8ea7968}]
@=“c:\\Program Files\\Microsoft Office Servers\\14.0\\Bin\\mswb7.dll“
toto konkretne zaregistruje ten cesky stemmer z Microsoft Search Server 2010 Express do MSSQL 2008 R2 (pro MSSQL 2008 a MSSQL 2005 by to zrejme slo podobne)

pak uz staci jen
exec sp_fulltext_service ‚update_languages‘;
exec sp_fulltext_service ‚restart_all_fdhosts‘;

overeni instalace (vypise se stemmer) s lcid 1029
exec sp_help_fulltext_system_components wordbreaker
SELECT * FROM sys.fulltext_languages order by lcid

sklonovat to umi:
select * from sys.dm_fts_parser(‚FORMSOF(INFLECTIONAL, květina)‘, 1029, 0, 0)

++++

jeste je asi treba tohle:
copy „c:\Program Files\Microsoft Office Servers\14.0\Data\Config\tsces.xml“ „c:\MSSQL2008R2\FTData“ (do slozky k ostatnim ts???.xml)
Noise Words, ktere jsou v Sharepointu 2010 ulozeny v c:\Program Files\Microsoft Office Servers\14.0\Data\Config\noiseces.txt by se na MSSQL 2008 R2 mely konfigurovat pres CREATE FULLTEXT STOPLIST

1 thought on “Český stemmer do MSSQL 2008 R2 x64

Zanechat odpověď

Vyplňte detaily níže nebo klikněte na ikonu pro přihlášení:

Logo WordPress.com

Komentujete pomocí vašeho WordPress.com účtu. Odhlásit /  Změnit )

Facebook photo

Komentujete pomocí vašeho Facebook účtu. Odhlásit /  Změnit )

Připojování k %s