Class Reference
Cache for UNIX 2018.1.3
InterSystems: The power behind what matters   
Documentation  Search
Private  Storage  

datatype class %Text.German extends %Text.Text

ODBC Type: VARCHAR

See %Text.Text

The %Text.German class implements the German language-specific stemming algorithm and initializes the language-specific list of noise words.

Inventory

Parameters Properties Methods Queries Indices ForeignKeys Triggers
5 2


Summary

Methods
AddDocToDictionary AddToDictionary AddToThesaurus BuildValueArray
ChooseSearchKey Classify CreateQList DecompressOffsets
DisplayToLogical DropDictionary EndOfWord ExcludeCommonTerms
IsValid LoadThesaurus LogicalToDisplay LogicalToOdbc
LogicalToXSD MakeSearchTerms Normalize RemoveDocFromDictionary
RemoveFromThesaurus SeparateWords Similarity SimilarityIdx
Standardize Translate XSDToLogical ends
removeAllAccents setto stemWord


Parameters

• parameter DICTIONARY = 4;
The default dictionary for properties of this class. By overriding the DICTIONARY you can create separate dictionaries for different kinds of properties in the same language. For example, email documents, legal briefs, and medical records might each have a separate dictionary so that term frequency and document similarity can be appropriately estimated in each separate domain.
• parameter NOISEWORDS100 = "von zu und a in ist es Sie das er war für auf seien mit wie seins sie seien an ein haben dieses von oder hatte durch heiß Wort aber was einige wir Dose aus anderes waren alle dort wenn herauf verwenden Ihr wie besagt jedes sie welches ihr Zeit wenn Wille Weise über viele dann sie schreiben wurde wie so diese sie lang bilden Sache sehen er zwei hat Blick mehr Tag könnte gehen gekommen Zahl Ton nein meisten Leute mein rüber wissen Wasser als Anruf zuerst wer können unten Seite gewesen jetzt Entdeckung irgendwelche neu Arbeit Teil Nehmen erhalten";
NOISEWORDSnnn lists the most common words in the language, in order of their frequency of occurrence. See http://www.ranks.nl/stopwords/ for a list of commonly used noise words for many different languages.
• parameter NOISEWORDS200 = "Platz gebildet Phasen wo nachher Rückseite wenig nur rund Mann Jahr kam Erscheinen jedes gut ich Geben unser unter Name sehr durch gerade Form Satz groß denken Sagen Hilfe niedrig Linie unterscheiden Umdrehung Ursache viel Mittel vorher Bewegung Recht Junge alt auch selben sagen Sie Satz drei wünschen Luft Brunnen auch Spiel klein Ende gesetzt Haupt gelesen Hand Tor groß Bann fügen hinzu glätten Land hier Muß groß hoch so folgen Tat warum bitten Männer Änderung ging Licht freundlich weg Notwendigkeit Haus Abbildung Versuch wir wieder Tier Punkt Mutter Welt nahe Bau Selbst Masse Vater Kopf Standplatz besitzen Seite wenn Land gefunden Antwort Schule";
• parameter NOISEWORDS300 = "wachsen Studie noch erlernen Betrieb Abdeckung Nahrung Sonne vier zwischen Zustand Unterhalt Auge nie Letztes gelassen Gedanke Stadt Baum Kreuz Bauernhof stark Anfang Macht Geschichte Säge weit Meer abgehobener Betrag link spät Durchlauf nicht während Presse Ende Nacht real Leben wenige Nord geöffnet scheinen zusammen zunächst weiß Kinder fangen erhalten Weg Beispiel Mühelosigkeit Papier Gruppe immer Musik die beide Markierung häufig Buchstabe bis Meile Fluß Auto Füße Obacht zweitens Buch tragen Sie nahm Wissenschaft essen Raum Freund fing an Idee Fische Berg Anschlag sobald Unterseite hören Pferd Schnitt sicher Uhr Farbe Gesicht Holz hauptsächlich genug Ebene Mädchen üblich jung bereiten über überhaupt rot Liste obwohl Gefühl";
• parameter SOURCELANGUAGE = "de";
SOURCELANGUAGEUAGE specifies the default source language to translate documents or queries from. This enables documents written and stored in multiple langauges to be queried in a single common language.

Methods

• classmethod removeAllAccents(ByRef b As %String, ByRef k As %Integer)
• classmethod stemWord(ByRef b As %String) as %String
Simple German stemmer. See http://www.unine.ch/info/clef/germanStemmer.txt


Copyright © 1997-2019, InterSystems Corporation