%Text.French

datatype class %Text.French extends %Text.Text

ODBC Type: VARCHAR

See %Text.Text

The %Text.French class implements the French language-specific stemming algorithm and initializes the language-specific list of noise words.

Inventory

Parameters Properties Methods Queries Indices ForeignKeys Triggers
5 4

Summary

Methods
AddDocToDictionary AddToDictionary AddToThesaurus BuildValueArray
ChooseSearchKey Classify CreateQList DecompressOffsets
DisplayToLogical DropDictionary EndOfWord ExcludeCommonTerms
IsValid LoadThesaurus LogicalToDisplay LogicalToOdbc
LogicalToXSD MakeSearchTerms Normalize RemoveDocFromDictionary
RemoveFromThesaurus SeparateWords Similarity SimilarityIdx
Standardize Translate XSDToLogical ends
normFrenchWord removeAllAccents removeDoublet setto
stemWord

Parameters

parameter DICTIONARY = 3;
The default dictionary for properties of this class. By overriding the DICTIONARY you can create separate dictionaries for different kinds of properties in the same language. For example, email documents, legal briefs, and medical records might each have a separate dictionary so that term frequency and document similarity can be appropriately estimated in each separate domain.
parameter NOISEWORDS100 = "de à et a dans est il vous cela était pour sur soyez avec sien ils soyez un ayez ceci de ou eu par chaud mot mais ce qui certains nous bidon hors autre étaient tous là quand vers le haut employez votre comment dit chacun elle quel leur temps si volonté manière au sujet beaucoup puis écrivez comme ainsi ceux ci elle long faites chose voyez deux regard plus jour pourrait allez venez nombre bruit non les plupart les gens mon savez l'eau que appel d'abord qui pouvez vers le bas côté été maintenant trouvaille";
NOISEWORDSnnn lists the most common words in the language, in order of their frequency of occurrence. See http://www.ranks.nl/stopwords/ for a list of commonly used noise words for many different languages.
parameter NOISEWORDS200 = "quels nouveau travail partie prise obtenez endroit fait phase ensuite dos peu seulement rond homme année soyez venu exposition chaque bon je élasticité notre sous nom très travers juste forme phrase grand pensez parole aide bas ligne différez tour cause beaucoup moyen avant mouvement droite garçon vieux aussi mêmes dites ensemble trois voulez air puits aussi jeu petit extrémité mis maison lu main port grand charme ajoutez égalisez terre ici nécessité grand haut tels suivez acte pourquoi demandez hommes changement allé lumière aimable outre besoin maison image essai nous encore animal point mère monde près construction portrait terre père";
parameter NOISEWORDS300 = "tête stand posséder page si pays trouvé réponse école développez étude toujours apprenez usine couverture nourriture soleil quatre entre état subsistance oeil jamais bout laissé pensée ville arbre croix ferme dur début force histoire scie loin mer aspiration gauche tard course pas tandis pression fin nuit vrai vie peu nord ouvert semblez ensemble après blanc enfants commencez obtenu promenade exemple facilité papier groupe toujours musique ceux tous marque souvent lettre jusque mille fleuve voiture pieds soin second livre portez pris science mangez pièce ami commencé idée poissons montagne arrêt fois base entendez cheval coupe sûr montre couleur visage bois principal";
parameter SOURCELANGUAGE = "fr";
SOURCELANGUAGEUAGE specifies the default source language to translate documents or queries from. This enables documents written and stored in multiple langauges to be queried in a single common language.

Methods

classmethod normFrenchWord(ByRef b As %String, ByRef k As %Integer)
classmethod removeAllAccents(ByRef b As %String, ByRef k As %Integer)
classmethod removeDoublet(ByRef b As %String, ByRef k As %Integer)
classmethod stemWord(ByRef b As %String) as %String
Remove plural and feminine form of French words
Copyright © 1997-2020 InterSystems Corporation, Cambridge, MA