-
Notifications
You must be signed in to change notification settings - Fork 2
Expand file tree
/
Copy pathmain2
More file actions
91 lines (71 loc) · 2.12 KB
/
main2
File metadata and controls
91 lines (71 loc) · 2.12 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
import pandas as pd
arquivo = r'C:\Users\JOAO VICTOR\Desktop\pesquisa-FEAdev.csv'
df = pd.read_csv(arquivo)
df = df.drop(columns = ['Carimbo de data/hora'])
cleandate = []
for i in df['Idade']:
i.strip()
i = int(i[0:2])
cleandate.append(i)
df['Idade'] = cleandate
sub18 = []
sub25 = []
sub35 = []
acima45 = []
for i in cleandate:
if i <= 18:
sub18.append(i)
if 19 <= i <= 25:
sub25.append(i)
if 26 <= i <= 35:
sub35.append(i)
if 36 <= i <= 45:
acima45.append(i)
cursos = []
df['Curso'] = df.Curso.fillna('nenhum')
for i in df['Curso']:
t = i.lower()
cursos.append(t.split())
for i in cursos:
if i[0] == 'engenharia':
del(i[1::])
elif len(i) == 2:
del(i[0])
def cleaning (a, b, c):
for i in a:
if i[0] == b:
i[0] = c
cleaning(cursos, 'econômicas', 'economia')
cleaning(cursos, 'adm', 'administração')
cleaning(cursos, 'atuaria', 'atuária')
cleaning(cursos, 'atuariais', 'atuária')
cleaning(cursos, 'farmacia', 'farmácia')
cleaning(cursos, 'pedagoga', 'pedagogia')
cleaning(cursos, 'contábeis', 'contabilidade')
cleaning2(cursos, 'arquitetura')
cleaning2(cursos, 'publicidade')
cursos = pd.Series(cursos)
df['Curso'] = cursos
df.columns = ['idade', 'genero', 'estudante', 'escolaridade', 'curso','instituicao', 'profissao', 'nível', 'investiu','renda', 'pretende', 'poupança', 'conhece', 'tipo']
"""
def relacao(a, b):
c = pd.DataFrame(df[a])
c[b] = df[b]
return c
df_vji_g = relacao('investiu', 'genero')
df_vji_esc = relacao('investiu', 'escolaridade')
df_vpp_vji = relacao('poupanca', 'investiu')
df_vpp_esc = relacao('poupanca','escolaridade')
df_lvl_tip = relacao('nível','tipo')
df_nce_esc = relacao('conhece','escolaridade')
df_tip_vji = relacao ('tipo','investiu')
df_tip_esc = relacao('tipo','escolaridade')
"""
df.loc[df['genero']=='Feminino','genero'] = 0
df.loc[df['genero']=='Masculino','genero'] = 1
df.loc[df['investiu']=='NÃO','investiu'] = 0
df.loc[df['investiu']=='SIM','investiu'] = 1
a = df['genero']
b = df['investiu']
plt.scatter(a,b)
plt.show()