-
Notifications
You must be signed in to change notification settings - Fork 1
Expand file tree
/
Copy pathregex.py
More file actions
91 lines (79 loc) · 4.91 KB
/
regex.py
File metadata and controls
91 lines (79 loc) · 4.91 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
import re
class custom_regex:
def __init__(self):
self.response = ''
def remove_diacritics(origText):
origText = re.sub('[áăắặằẳẵǎâấậầẩẫäǟȧǡạȁàảȃāąåǻḁⱥã]', 'a', origText)
origText = re.sub('[ÁĂẮẶẰẲẴǍÂẤẬẦẨẪÄǞȦǠẠȀÀẢȂĀĄÅǺḀȺÃ]', 'A', origText)
origText = re.sub('[ḃḅɓḇƀƃ]', 'b', origText)
origText = re.sub('[ḂḄƁḆɃƂ]', 'B', origText)
origText = re.sub('[ćčḉçĉċƈȼ]', 'c', origText)
origText = re.sub('[ĆČḈÇĈĊƇȻ]', 'C', origText)
origText = re.sub('[ďḑḓḋḍɗḏđƌdzdž]', 'd', origText)
origText = re.sub('[ĎḐḒḊḌƊḎDzDžĐƋDZDŽ]', 'D', origText)
origText = re.sub('[éĕěȩḝêếệềểễḙëėẹȅèẻȇēḗḕęɇẽḛ]', 'e', origText)
origText = re.sub('[ÉĔĚȨḜÊẾỆỀỂỄḘËĖẸȄÈẺȆĒḖḔĘɆẼḚ]', 'E', origText)
origText = re.sub('[ḟƒ]', 'f', origText)
origText = re.sub('[ḞƑ]', 'F', origText)
origText = re.sub('[ǵğǧģĝġɠḡǥ]', 'g', origText)
origText = re.sub('[ǴĞǦĢĜĠƓḠǤ]', 'G', origText)
origText = re.sub('[ḫȟḩĥⱨḧḣḥħ]', 'h', origText)
origText = re.sub('[ḪȞḨĤⱧḦḢḤĦ]', 'H', origText)
origText = re.sub('[ıíĭǐîïḯịȉìỉȋīįɨĩḭ]', 'i', origText)
origText = re.sub('[ÍĬǏÎÏḮİỊȈÌỈȊĪĮƗĨḬ]', 'I', origText)
origText = re.sub('[ǰĵɉ]', 'j', origText)
origText = re.sub('[ĴɈ]', 'J', origText)
origText = re.sub('[ḱǩķⱪḳƙḵ]', 'k', origText)
origText = re.sub('[ḰǨĶⱩḲƘḴ]', 'K', origText)
origText = re.sub('[ĺƚľļḽḷḹⱡḻŀł]', 'l', origText)
origText = re.sub('[ĹȽĽĻḼḶḸⱠḺĿLjŁ]', 'L', origText)
origText = re.sub('[ḿṁṃ]', 'm', origText)
origText = re.sub('[ḾṀṂ]', 'M', origText)
origText = re.sub('[ńňņṋṅṇǹɲṉƞñ]', 'n', origText)
origText = re.sub('[ŃŇŅṊṄṆǸƝṈȠNjÑ]', 'N', origText)
origText = re.sub('[óŏǒôốộồổỗöȫȯȱọőȍòỏơớợờởỡȏōṓṑǫǭøǿõṍṏȭ]', 'o', origText)
origText = re.sub('[ÓŎǑÔỐỘỒỔỖÖȪȮȰỌŐȌÒỎƠỚỢỜỞỠȎŌṒṐǪǬØǾÕṌṎȬ]', 'O', origText)
origText = re.sub('[ṕṗƥᵽ]', 'p', origText)
origText = re.sub('[ṔṖƤⱣ]', 'P', origText)
origText = re.sub('[ɋ]', 'q', origText)
origText = re.sub('[Ɋ]', 'Q', origText)
origText = re.sub('[ŕřŗṙṛṝȑȓṟɍɽ]', 'r', origText)
origText = re.sub('[ŔŘŖṘṚṜȐȒṞɌⱤ]', 'R', origText)
origText = re.sub('[śṥšṧşŝșṡṣṩ]', 's', origText)
origText = re.sub('[ŚṤŠṦŞŜȘṠṢṨ]', 'S', origText)
origText = re.sub('[ťţṱțẗⱦṫṭƭṯʈŧ]', 't', origText)
origText = re.sub('[ŤŢṰȚȾṪṬƬṮƮŦ]', 'T', origText)
origText = re.sub('[ʉúŭǔûṷüǘǚǜǖṳụűȕùủưứựừửữȗūṻųůũṹṵ]', 'u', origText)
origText = re.sub('[ɄÚŬǓÛṶÜǗǙǛǕṲỤŰȔÙỦƯỨỰỪỬỮȖŪṺŲŮŨṸṴ]', 'U', origText)
origText = re.sub('[ṿʋṽ]', 'v', origText)
origText = re.sub('[ṾƲṼ]', 'V', origText)
origText = re.sub('[ẃŵẅẇẉẁⱳẘ]', 'w', origText)
origText = re.sub('[ẂŴẄẆẈẀⱲ]', 'W', origText)
origText = re.sub('[ẍẋ]', 'x', origText)
origText = re.sub('[ẌẊ]', 'X', origText)
origText = re.sub('[ýŷÿẏỵỳƴỷȳẙɏỹ]', 'y', origText)
origText = re.sub('[ÝŶŸẎỴỲƳỶȲɎỸ]', 'Y', origText)
origText = re.sub('[ǽǣæ]', 'ae', origText)
origText = re.sub('[ǼǢÆ]', 'AE', origText)
origText = re.sub('[Þ]', 'th', origText)
origText = re.sub('[þ]', 'TH', origText)
origText = re.sub('[ß]', 'ss', origText)
origText = re.sub('[ß]', 'SS', origText)
origText = re.sub('[źžẑⱬżẓȥẕƶ]', 'z', origText)
origText = re.sub('[ŹŽẐⱫŻẒȤẔƵ]', 'Z', origText)
origText = re.sub('[œ]', 'oe', origText)
origText = re.sub('[Œ]', 'OE', origText)
origText = re.sub('[ð]', 'dj', origText)
origText = re.sub('[Ð]', 'DJ', origText)
origText = re.sub('[ij]', 'ij', origText)
origText = re.sub('[IJ]', 'IJ', origText)
origText = re.sub('[lj]', 'lj', origText)
origText = re.sub('[LJ]', 'LJ', origText)
origText = re.sub('[nj]', 'nj', origText)
origText = re.sub('[NJ]', 'NJ', origText)
origText = re.sub('★','*',origText)
return origText
def get_only_numbers(origText):
rgx = re.search("\d+", origText)
origText = rgx.group()
return str(origText)