Český stemmer do MSSQL 2008 R2 x64

Dneska se budu s laskavým svolením chlubit cizím peřím, uvádím postup (mnou neověřený, ale z důvěryhodného zdroje – od Roberta Kindla z firmy EXEC), jak do MS SQL 2008 R2 x64 dostat český stemmer pro fultextové vyhledávání:

****

musis nainstalovat Microsoft Search Server 2010 Express – to by melo byt zdarma a cesky stemmer to obsahuje

bohuzel je ale ten stemmer dostupny jen v tom Sharepointu (neregistruje se to do systemu)

takze jsem vlasnimi silami vyhackoval toto:
Windows Registry Editor Version 5.00
[HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10_50.SQL2008R2\MSSearch\Language\ces]
„TsaurusFile“=“tsces.xml“
„Locale“=dword:00000405
„WBreakerClass“=“{468bfc77-3876-4a47-a6ff-f5f6e8ea7968}“
„StemmerClass“=“{f51b7203-9bf9-4c39-b655-18fad8fa8a9a}“
[HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10_50.SQL2008R2\MSSearch\CLSID\{f51b7203-9bf9-4c39-b655-18fad8fa8a9a}]
@=“c:\\Program Files\\Microsoft Office Servers\\14.0\\Bin\\mswb7.dll“
[HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10_50.SQL2008R2\MSSearch\CLSID\{468bfc77-3876-4a47-a6ff-f5f6e8ea7968}]
@=“c:\\Program Files\\Microsoft Office Servers\\14.0\\Bin\\mswb7.dll“
toto konkretne zaregistruje ten cesky stemmer z Microsoft Search Server 2010 Express do MSSQL 2008 R2 (pro MSSQL 2008 a MSSQL 2005 by to zrejme slo podobne)

pak uz staci jen
exec sp_fulltext_service ‚update_languages‘;
exec sp_fulltext_service ‚restart_all_fdhosts‘;

overeni instalace (vypise se stemmer) s lcid 1029
exec sp_help_fulltext_system_components wordbreaker
SELECT * FROM sys.fulltext_languages order by lcid

sklonovat to umi:
select * from sys.dm_fts_parser(‚FORMSOF(INFLECTIONAL, květina)‘, 1029, 0, 0)

++++

jeste je asi treba tohle:
copy „c:\Program Files\Microsoft Office Servers\14.0\Data\Config\tsces.xml“ „c:\MSSQL2008R2\FTData“ (do slozky k ostatnim ts???.xml)
Noise Words, ktere jsou v Sharepointu 2010 ulozeny v c:\Program Files\Microsoft Office Servers\14.0\Data\Config\noiseces.txt by se na MSSQL 2008 R2 mely konfigurovat pres CREATE FULLTEXT STOPLIST

One thought on “Český stemmer do MSSQL 2008 R2 x64

Napsat komentář

Vyplňte detaily níže nebo klikněte na ikonu pro přihlášení:

WordPress.com Logo

Komentujete pomocí vašeho WordPress.com účtu. Log Out / Změnit )

Twitter picture

Komentujete pomocí vašeho Twitter účtu. Log Out / Změnit )

Facebook photo

Komentujete pomocí vašeho Facebook účtu. Log Out / Změnit )

Google+ photo

Komentujete pomocí vašeho Google+ účtu. Log Out / Změnit )

Připojování k %s