You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

304 lines
3.7 KiB

# -*- coding: utf-8 -*-
model = {
' th': 0,
'the': 1,
'he ': 2,
'ed ': 3,
' to': 4,
' in': 5,
'er ': 6,
'ing': 7,
'ng ': 8,
' an': 9,
'nd ': 10,
' of': 11,
'and': 12,
'to ': 13,
'of ': 14,
' co': 15,
'at ': 16,
'on ': 17,
'in ': 18,
' a ': 19,
'd t': 20,
' he': 21,
'e t': 22,
'ion': 23,
'es ': 24,
' re': 25,
're ': 26,
'hat': 27,
' sa': 28,
' st': 29,
' ha': 30,
'her': 31,
'tha': 32,
'tio': 33,
'or ': 34,
" ''": 35,
'en ': 36,
' wh': 37,
'e s': 38,
'ent': 39,
'n t': 40,
's a': 41,
'as ': 42,
'for': 43,
'is ': 44,
't t': 45,
' be': 46,
'ld ': 47,
'e a': 48,
'rs ': 49,
' wa': 50,
'ut ': 51,
've ': 52,
'll ': 53,
'al ': 54,
' ma': 55,
'e i': 56,
' fo': 57,
"'s ": 58,
'an ': 59,
'est': 60,
' hi': 61,
' mo': 62,
' se': 63,
' pr': 64,
's t': 65,
'ate': 66,
'st ': 67,
'ter': 68,
'ere': 69,
'ted': 70,
'nt ': 71,
'ver': 72,
'd a': 73,
' wi': 74,
'se ': 75,
'e c': 76,
'ect': 77,
'ns ': 78,
' on': 79,
'ly ': 80,
'tol': 81,
'ey ': 82,
'r t': 83,
' ca': 84,
'ati': 85,
'ts ': 86,
'all': 87,
' no': 88,
'his': 89,
's o': 90,
'ers': 91,
'con': 92,
'e o': 93,
'ear': 94,
'f t': 95,
'e w': 96,
'was': 97,
'ons': 98,
'sta': 99,
"'' ": 100,
'sti': 101,
'n a': 102,
'sto': 103,
't h': 104,
' we': 105,
'id ': 106,
'th ': 107,
' it': 108,
'ce ': 109,
' di': 110,
'ave': 111,
'd h': 112,
'cou': 113,
'pro': 114,
'ad ': 115,
'oll': 116,
'ry ': 117,
'd s': 118,
'e m': 119,
' so': 120,
'ill': 121,
'cti': 122,
'te ': 123,
'tor': 124,
'eve': 125,
'g t': 126,
'it ': 127,
' ch': 128,
' de': 129,
'hav': 130,
'oul': 131,
'ty ': 132,
'uld': 133,
'use': 134,
' al': 135,
'are': 136,
'ch ': 137,
'me ': 138,
'out': 139,
'ove': 140,
'wit': 141,
'ys ': 142,
'chi': 143,
't a': 144,
'ith': 145,
'oth': 146,
' ab': 147,
' te': 148,
' wo': 149,
's s': 150,
'res': 151,
't w': 152,
'tin': 153,
'e b': 154,
'e h': 155,
'nce': 156,
't s': 157,
'y t': 158,
'e p': 159,
'ele': 160,
'hin': 161,
's i': 162,
'nte': 163,
' li': 164,
'le ': 165,
' do': 166,
'aid': 167,
'hey': 168,
'ne ': 169,
's w': 170,
' as': 171,
' fr': 172,
' tr': 173,
'end': 174,
'sai': 175,
' el': 176,
' ne': 177,
' su': 178,
"'t ": 179,
'ay ': 180,
'hou': 181,
'ive': 182,
'lec': 183,
"n't": 184,
' ye': 185,
'but': 186,
'd o': 187,
'o t': 188,
'y o': 189,
' ho': 190,
' me': 191,
'be ': 192,
'cal': 193,
'e e': 194,
'had': 195,
'ple': 196,
' at': 197,
' bu': 198,
' la': 199,
'd b': 200,
's h': 201,
'say': 202,
't i': 203,
' ar': 204,
'e f': 205,
'ght': 206,
'hil': 207,
'igh': 208,
'int': 209,
'not': 210,
'ren': 211,
' is': 212,
' pa': 213,
' sh': 214,
'ays': 215,
'com': 216,
'n s': 217,
'r a': 218,
'rin': 219,
'y a': 220,
' un': 221,
'n c': 222,
'om ': 223,
'thi': 224,
' mi': 225,
'by ': 226,
'd i': 227,
'e d': 228,
'e n': 229,
't o': 230,
' by': 231,
'e r': 232,
'eri': 233,
'old': 234,
'ome': 235,
'whe': 236,
'yea': 237,
' gr': 238,
'ar ': 239,
'ity': 240,
'mpl': 241,
'oun': 242,
'one': 243,
'ow ': 244,
'r s': 245,
's f': 246,
'tat': 247,
' ba': 248,
' vo': 249,
'bou': 250,
'sam': 251,
'tim': 252,
'vot': 253,
'abo': 254,
'ant': 255,
'ds ': 256,
'ial': 257,
'ine': 258,
'man': 259,
'men': 260,
' or': 261,
' po': 262,
'amp': 263,
'can': 264,
'der': 265,
'e l': 266,
'les': 267,
'ny ': 268,
'ot ': 269,
'rec': 270,
'tes': 271,
'tho': 272,
'ica': 273,
'ild': 274,
'ir ': 275,
'nde': 276,
'ose': 277,
'ous': 278,
'pre': 279,
'ste': 280,
'era': 281,
'per': 282,
'r o': 283,
'red': 284,
'rie': 285,
' bo': 286,
' le': 287,
'ali': 288,
'ars': 289,
'ore': 290,
'ric': 291,
's m': 292,
'str': 293,
' fa': 294,
'ess': 295,
'ie ': 296,
'ist': 297,
'lat': 298,
'uri': 299,