Home > Class Reference > %SYS namespace > %Text.Spanish
Private  Storage   

%Text.Spanish


datatype class %Text.Spanish extends %Text.Text

ODBC Type: VARCHAR

See %Text.Text

The %Text.Spanish class implements the Spanish language-specific stemming algorithm and initializes the language-specific list of noise words.

Inventory


Parameters Properties Methods Queries Indices ForeignKeys Triggers
5 2


Summary


Methods
AddDocToDictionary AddToDictionary AddToThesaurus BuildValueArray
ChooseSearchKey Classify CreateQList DecompressOffsets
DisplayToLogical DropDictionary EndOfWord ExcludeCommonTerms
IsValid LoadThesaurus LogicalToDisplay LogicalToOdbc
LogicalToXSD MakeSearchTerms Normalize RemoveDocFromDictionary
RemoveFromThesaurus SeparateWords Similarity SimilarityIdx
Standardize Translate XSDToLogical ends
removeAllAccents setto stemWord


Parameters


• parameter DICTIONARY = 8;
The default dictionary for properties of this class. By overriding the DICTIONARY you can create separate dictionaries for different kinds of properties in the same language. For example, email documents, legal briefs, and medical records might each have a separate dictionary so that term frequency and document similarity can be appropriately estimated in each separate domain.
• parameter NOISEWORDS100 = "de a y a en es él usted eso el era para en sea con como el suyo ellos sea en uno tenga esto de o tenía por caliente palabra pero qué algunos nosotros lata fuera de otro eran todos allí cuando encima de utilice su cómo dicho cada uno ella cuál su tiempo si voluntad manera sobre muchos entonces ellos escriba como tan éstos ella largo haga cosa vea él dos tiene mirada más día podría vaya venido número sonido no la mayoría gente mi encima sepa agua que llamada primero quién pueda abajo lado sido ahora hallazgo cualesquiera nuevo trabajo parte toma";
NOISEWORDSnnn lists the most common words in the language, in order of their frequency of occurrence. See http://www.ranks.nl/stopwords/ for a list of commonly used noise words for many different languages.
• parameter NOISEWORDS200 = "consiga lugar hecho vivo donde después parte posteriora poco solamente redondo hombre año vino demostración cada bueno yo elasticidad nuestro debajo nom nombre muy por apenas forma oración grande piense opinión ayuda bajo línea diferencie vuelta causa mucho medio antes movimiento la derecha muchacho viejo también iguales diga sistema tres desee aire pozo también juego pequeño extremo puesto casero leído mano puerto grande encanto agregue iguale tierra aquí necesidad grande alto tales siga acto porqué pida hombres cambio fue luz bueno de necesidad casa cuadro intento nosotros otra vez animal punto madre mundo cerca estructura uno mismo tierra padre cabeza soporte poseer página si";
• parameter NOISEWORDS300 = "país encontrado respuesta escuela crezca estudio aún aprenda planta cubierta alimento sol cuatro entre estado subsistencia ojo nunca último dejado pensamiento ciudad árbol cruz granja difícilmente comienzo fuerza historia sierra lejos mar drenaje izquierdo tarde funcionamiento no mientras prensa cierre noche verdadero vida pocos norte abierto parézcase junto después blanco niños comience conseguido caminata ejemplo facilidad papel grupo siempre música ésos ambos marca a menudo letra hasta milla río coche pies cuidado segundo lugar libro lleve tomó ciencia coma sitio amigo comenzó idea pescados montaña parada una vez que base oiga caballo corte seguro reloj color cara madera principal bastantes llano";
• parameter SOURCELANGUAGE = "es";
SOURCELANGUAGEUAGE specifies the default source language to translate documents or queries from. This enables documents written and stored in multiple langauges to be queried in a single common language.

Methods


• classmethod removeAllAccents(ByRef b As %String, ByRef k As %Integer)
• classmethod stemWord(ByRef b As %String) as %String
Simple Italian stemmer. See http://www.unine.ch/info/clef/italianStemmer.txt