You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
304 lines
3.8 KiB
304 lines
3.8 KiB
# -*- coding: utf-8 -*-
|
|
model = {
|
|
'es ': 0,
|
|
' de': 1,
|
|
'de ': 2,
|
|
' le': 3,
|
|
'ent': 4,
|
|
'le ': 5,
|
|
'nt ': 6,
|
|
'la ': 7,
|
|
's d': 8,
|
|
' la': 9,
|
|
'ion': 10,
|
|
'on ': 11,
|
|
're ': 12,
|
|
' pa': 13,
|
|
'e l': 14,
|
|
'e d': 15,
|
|
" l'": 16,
|
|
'e p': 17,
|
|
' co': 18,
|
|
' pr': 19,
|
|
'tio': 20,
|
|
'ns ': 21,
|
|
' en': 22,
|
|
'ne ': 23,
|
|
'que': 24,
|
|
'r l': 25,
|
|
'les': 26,
|
|
'ur ': 27,
|
|
'en ': 28,
|
|
'ati': 29,
|
|
'ue ': 30,
|
|
' po': 31,
|
|
" d'": 32,
|
|
'par': 33,
|
|
' a ': 34,
|
|
'et ': 35,
|
|
'it ': 36,
|
|
' qu': 37,
|
|
'men': 38,
|
|
'ons': 39,
|
|
'te ': 40,
|
|
' et': 41,
|
|
't d': 42,
|
|
' re': 43,
|
|
'des': 44,
|
|
' un': 45,
|
|
'ie ': 46,
|
|
's l': 47,
|
|
' su': 48,
|
|
'pou': 49,
|
|
' au': 50,
|
|
' à ': 51,
|
|
'con': 52,
|
|
'er ': 53,
|
|
' no': 54,
|
|
'ait': 55,
|
|
'e c': 56,
|
|
'se ': 57,
|
|
'té ': 58,
|
|
'du ': 59,
|
|
' du': 60,
|
|
' dé': 61,
|
|
'ce ': 62,
|
|
'e e': 63,
|
|
'is ': 64,
|
|
'n d': 65,
|
|
's a': 66,
|
|
' so': 67,
|
|
'e r': 68,
|
|
'e s': 69,
|
|
'our': 70,
|
|
'res': 71,
|
|
'ssi': 72,
|
|
'eur': 73,
|
|
' se': 74,
|
|
'eme': 75,
|
|
'est': 76,
|
|
'us ': 77,
|
|
'sur': 78,
|
|
'ant': 79,
|
|
'iqu': 80,
|
|
's p': 81,
|
|
'une': 82,
|
|
'uss': 83,
|
|
"l'a": 84,
|
|
'pro': 85,
|
|
'ter': 86,
|
|
'tre': 87,
|
|
'end': 88,
|
|
'rs ': 89,
|
|
' ce': 90,
|
|
'e a': 91,
|
|
't p': 92,
|
|
'un ': 93,
|
|
' ma': 94,
|
|
' ru': 95,
|
|
' ré': 96,
|
|
'ous': 97,
|
|
'ris': 98,
|
|
'rus': 99,
|
|
'sse': 100,
|
|
'ans': 101,
|
|
'ar ': 102,
|
|
'com': 103,
|
|
'e m': 104,
|
|
'ire': 105,
|
|
'nce': 106,
|
|
'nte': 107,
|
|
't l': 108,
|
|
' av': 109,
|
|
' mo': 110,
|
|
' te': 111,
|
|
'il ': 112,
|
|
'me ': 113,
|
|
'ont': 114,
|
|
'ten': 115,
|
|
'a p': 116,
|
|
'dan': 117,
|
|
'pas': 118,
|
|
'qui': 119,
|
|
's e': 120,
|
|
's s': 121,
|
|
' in': 122,
|
|
'ist': 123,
|
|
'lle': 124,
|
|
'nou': 125,
|
|
'pré': 126,
|
|
"'un": 127,
|
|
'air': 128,
|
|
"d'a": 129,
|
|
'ir ': 130,
|
|
'n e': 131,
|
|
'rop': 132,
|
|
'ts ': 133,
|
|
' da': 134,
|
|
'a s': 135,
|
|
'as ': 136,
|
|
'au ': 137,
|
|
'den': 138,
|
|
'mai': 139,
|
|
'mis': 140,
|
|
'ori': 141,
|
|
'out': 142,
|
|
'rme': 143,
|
|
'sio': 144,
|
|
'tte': 145,
|
|
'ux ': 146,
|
|
'a d': 147,
|
|
'ien': 148,
|
|
'n a': 149,
|
|
'ntr': 150,
|
|
'omm': 151,
|
|
'ort': 152,
|
|
'ouv': 153,
|
|
's c': 154,
|
|
'son': 155,
|
|
'tes': 156,
|
|
'ver': 157,
|
|
'ère': 158,
|
|
' il': 159,
|
|
' m ': 160,
|
|
' sa': 161,
|
|
' ve': 162,
|
|
'a r': 163,
|
|
'ais': 164,
|
|
'ava': 165,
|
|
'di ': 166,
|
|
'n p': 167,
|
|
'sti': 168,
|
|
'ven': 169,
|
|
' mi': 170,
|
|
'ain': 171,
|
|
'enc': 172,
|
|
'for': 173,
|
|
'ité': 174,
|
|
'lar': 175,
|
|
'oir': 176,
|
|
'rem': 177,
|
|
'ren': 178,
|
|
'rro': 179,
|
|
'rés': 180,
|
|
'sie': 181,
|
|
't a': 182,
|
|
'tur': 183,
|
|
' pe': 184,
|
|
' to': 185,
|
|
"d'u": 186,
|
|
'ell': 187,
|
|
'err': 188,
|
|
'ers': 189,
|
|
'ide': 190,
|
|
'ine': 191,
|
|
'iss': 192,
|
|
'mes': 193,
|
|
'por': 194,
|
|
'ran': 195,
|
|
'sit': 196,
|
|
'st ': 197,
|
|
't r': 198,
|
|
'uti': 199,
|
|
'vai': 200,
|
|
'é l': 201,
|
|
'ési': 202,
|
|
' di': 203,
|
|
" n'": 204,
|
|
' ét': 205,
|
|
'a c': 206,
|
|
'ass': 207,
|
|
'e t': 208,
|
|
'in ': 209,
|
|
'nde': 210,
|
|
'pre': 211,
|
|
'rat': 212,
|
|
's m': 213,
|
|
'ste': 214,
|
|
'tai': 215,
|
|
'tch': 216,
|
|
'ui ': 217,
|
|
'uro': 218,
|
|
'ès ': 219,
|
|
' es': 220,
|
|
' fo': 221,
|
|
' tr': 222,
|
|
"'ad": 223,
|
|
'app': 224,
|
|
'aux': 225,
|
|
'e à': 226,
|
|
'ett': 227,
|
|
'iti': 228,
|
|
'lit': 229,
|
|
'nal': 230,
|
|
'opé': 231,
|
|
'r d': 232,
|
|
'ra ': 233,
|
|
'rai': 234,
|
|
'ror': 235,
|
|
's r': 236,
|
|
'tat': 237,
|
|
'uté': 238,
|
|
'à l': 239,
|
|
' af': 240,
|
|
'anc': 241,
|
|
'ara': 242,
|
|
'art': 243,
|
|
'bre': 244,
|
|
'ché': 245,
|
|
'dre': 246,
|
|
'e f': 247,
|
|
'ens': 248,
|
|
'lem': 249,
|
|
'n r': 250,
|
|
'n t': 251,
|
|
'ndr': 252,
|
|
'nne': 253,
|
|
'onn': 254,
|
|
'pos': 255,
|
|
's t': 256,
|
|
'tiq': 257,
|
|
'ure': 258,
|
|
' tu': 259,
|
|
'ale': 260,
|
|
'and': 261,
|
|
'ave': 262,
|
|
'cla': 263,
|
|
'cou': 264,
|
|
'e n': 265,
|
|
'emb': 266,
|
|
'ins': 267,
|
|
'jou': 268,
|
|
'mme': 269,
|
|
'rie': 270,
|
|
'rès': 271,
|
|
'sem': 272,
|
|
'str': 273,
|
|
't i': 274,
|
|
'ues': 275,
|
|
'uni': 276,
|
|
'uve': 277,
|
|
'é d': 278,
|
|
'ée ': 279,
|
|
' ch': 280,
|
|
' do': 281,
|
|
' eu': 282,
|
|
' fa': 283,
|
|
' lo': 284,
|
|
' ne': 285,
|
|
' ra': 286,
|
|
'arl': 287,
|
|
'att': 288,
|
|
'ec ': 289,
|
|
'ica': 290,
|
|
'l a': 291,
|
|
"l'o": 292,
|
|
"l'é": 293,
|
|
'mmi': 294,
|
|
'nta': 295,
|
|
'orm': 296,
|
|
'ou ': 297,
|
|
'r u': 298,
|
|
'rle': 299,
|
|
}
|