Home > Class Reference > %SYS namespace > %Text.Italian
Private  Storage   

%Text.Italian


datatype class %Text.Italian extends %Text.Text

ODBC Type: VARCHAR

See %Text.Text

The %Text.Italian class implements the Italian language-specific stemming algorithm and initializes the language-specific list of noise words.

Inventory


Parameters Properties Methods Queries Indices ForeignKeys Triggers
5 2


Summary


Methods
AddDocToDictionary AddToDictionary AddToThesaurus BuildValueArray
ChooseSearchKey Classify CreateQList DecompressOffsets
DisplayToLogical DropDictionary EndOfWord ExcludeCommonTerms
IsValid LoadThesaurus LogicalToDisplay LogicalToOdbc
LogicalToXSD MakeSearchTerms Normalize RemoveDocFromDictionary
RemoveFromThesaurus SeparateWords Similarity SimilarityIdx
Standardize Translate XSDToLogical ends
removeAllAccents setto stemWord


Parameters


• parameter DICTIONARY = 5;
The default dictionary for properties of this class. By overriding the DICTIONARY you can create separate dictionaries for different kinds of properties in the same language. For example, email documents, legal briefs, and medical records might each have a separate dictionary so that term frequency and document similarity can be appropriately estimated in each separate domain.
• parameter NOISEWORDS100 = "di a e a in è esso voi quello lui era per su sia con As I suo sia uno abbia ciò da o ha avuto da caldo parola ma che cosa alcuni noi latta verso l'esterno altro erano tutti là quando su usi vostro come detto ciascuno lei quale loro tempo se volontà senso circa molti allora loro scriva come così questi lei lungo faccia cosa veda lui due ha sguardo più giorno potrebbe vada venuto numero suono no maggior parte gente mio sopra sappia acqua che chiamata primo luogo chi possa giù lato stato ora ritrovamento c'è ne nuovo lavoro parte introito ottenga posto";
NOISEWORDSnnn lists the most common words in the language, in order of their frequency of occurrence. See http://www.ranks.nl/stopwords/ for a list of commonly used noise words for many different languages.
• parameter NOISEWORDS200 = "fatto tensione dove dopo parte posteriore poco soltanto rotondo uomo anno venuto esposizione ogni buon me give nostro sotto nome molto attraverso appena forma frase grande pensi opinione aiuto basso linea differisca girata causa molto media prima movimento destra ragazzo vecchio anche stessi dica insieme tre desideri aria pozzo anche gioco piccolo estremità messo domestico colto mano orificio grande periodo aggiunga livelli terra qui mosto grande alto tali segua atto perchè chieda uomini cambiamento è andato luce gentile fuori bisogno casa immagine prova noi ancora animale punto madre mondo vicino configurazione auto terra padre testa basamento possedere pagina se paese trovato risposta scuola sviluppisi";
• parameter NOISEWORDS300 = "studio ancora impari pianta copertura alimento sole quattro fra dichiari conservazione occhio mai ultimo lasciato pensiero città albero traversa podere duro inizio forza storia sega lontano mare tiraggio di sinistra in ritardo funzionamento non mentre pressa fine notte reale vita pochi del nord aperto sembri insieme dopo bianco bambini cominci ottenuto camminata esempio facilità carta gruppo sempre musica quelli entrambi contrassegno spesso lettera fino a miglio fiume automobile piedi cura secondo luogo libro trasporti ha preso scienza mangi stanza amico ha cominciato idea pesci montagna arresto volta base sentasi cavallo taglio sicuro vigilanza colore faccia legno principale abbastanza pianura ragazza usuale giovane aspetti sopra mai rosso lista benchè";
• parameter SOURCELANGUAGE = "it";
SOURCELANGUAGEUAGE specifies the default source language to translate documents or queries from. This enables documents written and stored in multiple langauges to be queried in a single common language.

Methods


• classmethod removeAllAccents(ByRef b As %String, ByRef k As %Integer)
[Previously private]
• classmethod stemWord(ByRef b As %String) as %String
Simple Italian stemmer. See http://www.unine.ch/info/clef/italianStemmer.txt [Previously private]