You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
304 lines
3.7 KiB
304 lines
3.7 KiB
# -*- coding: utf-8 -*-
|
|
model = {
|
|
' th': 0,
|
|
'the': 1,
|
|
'he ': 2,
|
|
'ed ': 3,
|
|
' to': 4,
|
|
' in': 5,
|
|
'er ': 6,
|
|
'ing': 7,
|
|
'ng ': 8,
|
|
' an': 9,
|
|
'nd ': 10,
|
|
' of': 11,
|
|
'and': 12,
|
|
'to ': 13,
|
|
'of ': 14,
|
|
' co': 15,
|
|
'at ': 16,
|
|
'on ': 17,
|
|
'in ': 18,
|
|
' a ': 19,
|
|
'd t': 20,
|
|
' he': 21,
|
|
'e t': 22,
|
|
'ion': 23,
|
|
'es ': 24,
|
|
' re': 25,
|
|
're ': 26,
|
|
'hat': 27,
|
|
' sa': 28,
|
|
' st': 29,
|
|
' ha': 30,
|
|
'her': 31,
|
|
'tha': 32,
|
|
'tio': 33,
|
|
'or ': 34,
|
|
" ''": 35,
|
|
'en ': 36,
|
|
' wh': 37,
|
|
'e s': 38,
|
|
'ent': 39,
|
|
'n t': 40,
|
|
's a': 41,
|
|
'as ': 42,
|
|
'for': 43,
|
|
'is ': 44,
|
|
't t': 45,
|
|
' be': 46,
|
|
'ld ': 47,
|
|
'e a': 48,
|
|
'rs ': 49,
|
|
' wa': 50,
|
|
'ut ': 51,
|
|
've ': 52,
|
|
'll ': 53,
|
|
'al ': 54,
|
|
' ma': 55,
|
|
'e i': 56,
|
|
' fo': 57,
|
|
"'s ": 58,
|
|
'an ': 59,
|
|
'est': 60,
|
|
' hi': 61,
|
|
' mo': 62,
|
|
' se': 63,
|
|
' pr': 64,
|
|
's t': 65,
|
|
'ate': 66,
|
|
'st ': 67,
|
|
'ter': 68,
|
|
'ere': 69,
|
|
'ted': 70,
|
|
'nt ': 71,
|
|
'ver': 72,
|
|
'd a': 73,
|
|
' wi': 74,
|
|
'se ': 75,
|
|
'e c': 76,
|
|
'ect': 77,
|
|
'ns ': 78,
|
|
' on': 79,
|
|
'ly ': 80,
|
|
'tol': 81,
|
|
'ey ': 82,
|
|
'r t': 83,
|
|
' ca': 84,
|
|
'ati': 85,
|
|
'ts ': 86,
|
|
'all': 87,
|
|
' no': 88,
|
|
'his': 89,
|
|
's o': 90,
|
|
'ers': 91,
|
|
'con': 92,
|
|
'e o': 93,
|
|
'ear': 94,
|
|
'f t': 95,
|
|
'e w': 96,
|
|
'was': 97,
|
|
'ons': 98,
|
|
'sta': 99,
|
|
"'' ": 100,
|
|
'sti': 101,
|
|
'n a': 102,
|
|
'sto': 103,
|
|
't h': 104,
|
|
' we': 105,
|
|
'id ': 106,
|
|
'th ': 107,
|
|
' it': 108,
|
|
'ce ': 109,
|
|
' di': 110,
|
|
'ave': 111,
|
|
'd h': 112,
|
|
'cou': 113,
|
|
'pro': 114,
|
|
'ad ': 115,
|
|
'oll': 116,
|
|
'ry ': 117,
|
|
'd s': 118,
|
|
'e m': 119,
|
|
' so': 120,
|
|
'ill': 121,
|
|
'cti': 122,
|
|
'te ': 123,
|
|
'tor': 124,
|
|
'eve': 125,
|
|
'g t': 126,
|
|
'it ': 127,
|
|
' ch': 128,
|
|
' de': 129,
|
|
'hav': 130,
|
|
'oul': 131,
|
|
'ty ': 132,
|
|
'uld': 133,
|
|
'use': 134,
|
|
' al': 135,
|
|
'are': 136,
|
|
'ch ': 137,
|
|
'me ': 138,
|
|
'out': 139,
|
|
'ove': 140,
|
|
'wit': 141,
|
|
'ys ': 142,
|
|
'chi': 143,
|
|
't a': 144,
|
|
'ith': 145,
|
|
'oth': 146,
|
|
' ab': 147,
|
|
' te': 148,
|
|
' wo': 149,
|
|
's s': 150,
|
|
'res': 151,
|
|
't w': 152,
|
|
'tin': 153,
|
|
'e b': 154,
|
|
'e h': 155,
|
|
'nce': 156,
|
|
't s': 157,
|
|
'y t': 158,
|
|
'e p': 159,
|
|
'ele': 160,
|
|
'hin': 161,
|
|
's i': 162,
|
|
'nte': 163,
|
|
' li': 164,
|
|
'le ': 165,
|
|
' do': 166,
|
|
'aid': 167,
|
|
'hey': 168,
|
|
'ne ': 169,
|
|
's w': 170,
|
|
' as': 171,
|
|
' fr': 172,
|
|
' tr': 173,
|
|
'end': 174,
|
|
'sai': 175,
|
|
' el': 176,
|
|
' ne': 177,
|
|
' su': 178,
|
|
"'t ": 179,
|
|
'ay ': 180,
|
|
'hou': 181,
|
|
'ive': 182,
|
|
'lec': 183,
|
|
"n't": 184,
|
|
' ye': 185,
|
|
'but': 186,
|
|
'd o': 187,
|
|
'o t': 188,
|
|
'y o': 189,
|
|
' ho': 190,
|
|
' me': 191,
|
|
'be ': 192,
|
|
'cal': 193,
|
|
'e e': 194,
|
|
'had': 195,
|
|
'ple': 196,
|
|
' at': 197,
|
|
' bu': 198,
|
|
' la': 199,
|
|
'd b': 200,
|
|
's h': 201,
|
|
'say': 202,
|
|
't i': 203,
|
|
' ar': 204,
|
|
'e f': 205,
|
|
'ght': 206,
|
|
'hil': 207,
|
|
'igh': 208,
|
|
'int': 209,
|
|
'not': 210,
|
|
'ren': 211,
|
|
' is': 212,
|
|
' pa': 213,
|
|
' sh': 214,
|
|
'ays': 215,
|
|
'com': 216,
|
|
'n s': 217,
|
|
'r a': 218,
|
|
'rin': 219,
|
|
'y a': 220,
|
|
' un': 221,
|
|
'n c': 222,
|
|
'om ': 223,
|
|
'thi': 224,
|
|
' mi': 225,
|
|
'by ': 226,
|
|
'd i': 227,
|
|
'e d': 228,
|
|
'e n': 229,
|
|
't o': 230,
|
|
' by': 231,
|
|
'e r': 232,
|
|
'eri': 233,
|
|
'old': 234,
|
|
'ome': 235,
|
|
'whe': 236,
|
|
'yea': 237,
|
|
' gr': 238,
|
|
'ar ': 239,
|
|
'ity': 240,
|
|
'mpl': 241,
|
|
'oun': 242,
|
|
'one': 243,
|
|
'ow ': 244,
|
|
'r s': 245,
|
|
's f': 246,
|
|
'tat': 247,
|
|
' ba': 248,
|
|
' vo': 249,
|
|
'bou': 250,
|
|
'sam': 251,
|
|
'tim': 252,
|
|
'vot': 253,
|
|
'abo': 254,
|
|
'ant': 255,
|
|
'ds ': 256,
|
|
'ial': 257,
|
|
'ine': 258,
|
|
'man': 259,
|
|
'men': 260,
|
|
' or': 261,
|
|
' po': 262,
|
|
'amp': 263,
|
|
'can': 264,
|
|
'der': 265,
|
|
'e l': 266,
|
|
'les': 267,
|
|
'ny ': 268,
|
|
'ot ': 269,
|
|
'rec': 270,
|
|
'tes': 271,
|
|
'tho': 272,
|
|
'ica': 273,
|
|
'ild': 274,
|
|
'ir ': 275,
|
|
'nde': 276,
|
|
'ose': 277,
|
|
'ous': 278,
|
|
'pre': 279,
|
|
'ste': 280,
|
|
'era': 281,
|
|
'per': 282,
|
|
'r o': 283,
|
|
'red': 284,
|
|
'rie': 285,
|
|
' bo': 286,
|
|
' le': 287,
|
|
'ali': 288,
|
|
'ars': 289,
|
|
'ore': 290,
|
|
'ric': 291,
|
|
's m': 292,
|
|
'str': 293,
|
|
' fa': 294,
|
|
'ess': 295,
|
|
'ie ': 296,
|
|
'ist': 297,
|
|
'lat': 298,
|
|
'uri': 299,
|
|
}
|