-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy pathatom.xml
More file actions
1099 lines (862 loc) · 92.3 KB
/
atom.xml
File metadata and controls
1099 lines (862 loc) · 92.3 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">
<title>我的博客</title>
<subtitle>每天进步一点点~~~</subtitle>
<link href="/atom.xml" rel="self"/>
<link href="http://hxbbing.github.io/"/>
<updated>2017-10-28T14:09:13.090Z</updated>
<id>http://hxbbing.github.io/</id>
<author>
<name>Xiangbing Huang</name>
</author>
<generator uri="http://hexo.io/">Hexo</generator>
<entry>
<title>大数据挖掘常用的方法有哪些</title>
<link href="http://hxbbing.github.io/2017/10/28/%E5%A4%A7%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98%E5%B8%B8%E7%94%A8%E7%9A%84%E6%96%B9%E6%B3%95%E6%9C%89%E5%93%AA%E4%BA%9B/"/>
<id>http://hxbbing.github.io/2017/10/28/大数据挖掘常用的方法有哪些/</id>
<published>2017-10-28T13:43:46.000Z</published>
<updated>2017-10-28T14:09:13.090Z</updated>
<content type="html"><![CDATA[<p>在大数据时代,数据挖掘是最关键的工作。大数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程,也是一种决策支持过程。其主要基于人工智能,机器学习,模式学习,统计学等。通过对大数据高度自动化地分析,做出归纳性的推理,从中挖掘出潜在的模式,可以帮助企业、商家、用户调整市场政策、减少风险、理性面对市场,并做出正确的决策。目前,在很多领域尤其是在商业领域如银行、电信、电商等,数据挖掘可以解决很多问题,包括市场营销策略制定、背景分析、企业管理危机等。大数据的挖掘常用的方法有<font color="red">分类、回归分析、聚类、关联规则、神经网络方法、Web 数据挖掘等。</font>这些方法从不同的角度对数据进行挖掘。</p>
<p>(1)分类。分类是找出数据库中的一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到摸个给定的类别中。可以应用到涉及到应用分类、趋势预测中,如淘宝商铺将用户在一段时间内的购买情况划分成不同的类,根据情况向用户推荐关联类的商品,从而增加商铺的销售量。</p>
<p>(2)回归分析。回归分析反映了数据库中数据的属性值的特性,通过函数表达数据映射的关系来发现属性值之间的依赖关系。它可以应用到对数据序列的预测及相关关系的研究中去。在市场营销中,回归分析可以被应用到各个方面。如通过对本季度销售的回归分析,对下一季度的销售趋势作出预测并做出针对性的营销改变。</p>
<p>(3)聚类。聚类类似于分类,但与分类的目的不同,是针对数据的相似性和差异性将一组数据分为几个类别。属于同一类别的数据间的相似性很大,但不同类别之间数据的相似性很小,跨类的数据关联性很低。</p>
<p>(4)关联规则。关联规则是隐藏在数据项之间的关联或相互关系,即可以根据一个数据项的出现推导出其他数据项的出现。关联规则的挖掘过程主要包括两个阶段:第一阶段为从海量原始数据中找出所有的高频项目组;第二极端为从这些高频项目组产生关联规则。关联规则挖掘技术已经被广泛应用于金融行业企业中用以预测客户的需求,各银行在自己的ATM 机上通过捆绑客户可能感兴趣的信息供用户了解并获取相应信息来改善自身的营销。</p>
<p>(5)神经网络方法。神经网络作为一种先进的人工智能技术,因其自身自行处理、分布存储和高度容错等特性非常适合处理非线性的以及那些以模糊、不完整、不严密的知识或数据为特征的处理问题,它的这一特点十分适合解决数据挖掘的问题。典型的神经网络模型主要分为三大类:第一类是以用于分类预测和模式识别的前馈式神经网络模型,其主要代表为函数型网络、感知机;第二类是用于联想记忆和优化算法的反馈式神经网络模型,以Hopfield 的离散模型和连续模型为代表。第三类是用于聚类的自组织映射方法,以ART 模型为代表。虽然神经网络有多种模型及算法,但在特定领域的数据挖掘中使用何种模型及算法并没有统一的规则,而且人们很难理解网络的学习及决策过程。</p>
<p>(6)Web数据挖掘。Web数据挖掘是一项综合性技术,指Web 从文档结构和使用的集合C 中发现隐含的模式P,如果将C看做是输入,P 看做是输出,那么Web 挖掘过程就可以看做是从输入到输出的一个映射过程。</p>
<p>当前越来越多的Web 数据都是以数据流的形式出现的,因此对Web 数据流挖掘就具有很重要的意义。目前常用的Web数据挖掘算法有:PageRank算法,HITS算法以及LOGSOM 算法。这三种算法提到的用户都是笼统的用户,并没有区分用户的个体。目前Web 数据挖掘面临着一些问题,包括:用户的分类问题、网站内容时效性问题,用户在页面停留时间问题,页面的链入与链出数问题等。在Web 技术高速发展的今天,这些问题仍旧值得研究并加以解决。</p>
<font color="red">1.基于历史的MBR分析</font>
<p>基于历史(Memory-Based Reasoning)的MBR分析方法最主要的概念是用已知的案例(case)来预测未来案例的一些属性(attribute),通常找寻最相似的案例来做比较。<br>MBR中有两个主要的要素,分别为距离函数(distance function)与结合函数(combination function)。距离函数的用意在找出最相似的案例;结合函数则将相似案例的属性结合起来,以供预测之用。<br>MBR的优点是它容许各种型态的数据,这些数据不需服从某些假设。另一个优点是其具备学习能力,它能藉由旧案例的学习来获取关于新案例的知识。较令人诟病的是它需要大量的历史数据,有足够 的历史数据方能做良好的预测。此外记忆基础推理法在处理上亦较为费时,不易发现最佳的距离函数与结合函数。其可应用的范围包括欺骗行为的侦测、客户反应预测、医学诊疗、反应的归类等方面。</p>
<font color="red">2.购物篮分析</font>
<p>购物篮分析(Market Basket Analysis)最主要的目的在于找出什么样的东西应该放在一起?商业上的应用在藉由顾客的购买行为来了解是什么样的顾客以及这些顾客为什么买这些产品, 找出相关的联想(association)规则,企业藉由这些规则的挖掘获得利益与建立竞争优势。举例来说,零售店可藉由此分析改变置物架上的商品排列或是设计 吸引客户的商业套餐等等。<br>购物篮分析基本运作过程包含下列三点:</p>
<ol>
<li>选择正确的品项:这里所指的正确乃是针对企业体而言,必须要在数以百计、千计品项中选择出真正有用的品项出来。</li>
<li>经由对共同发生矩阵(co-occurrence matrix)的探讨挖掘出联想规则。</li>
<li>克服实际上的限制:所选择的品项愈多,计算所耗费的资源与时间愈久(呈现指数递增),此时必须运用一些技术以降低资源与时间的损耗。<br>购物篮分析技术可以应用在下列问题上:针对信用卡购物,能够预测未来顾客可能购买什么。对于电信与金融服务业而言,经由购物篮分析能够设计不同的服务组合以扩大利润。保险业能藉由购物篮分析侦测出可能不寻常的投保组合并作预防。对病人而言,在疗程的组合上,购物篮分析能作为是否这些疗程组合会导致并发症的判断依据。</li>
</ol>
<font color="red">3.决策树</font>
<p>决策树(Decision Trees)在解决归类与预测上有着极强的能力,它以法则的方式表达,而这些法则则以一连串的问题表示出来,经由不断询问问题最终能导出所需的结果。典型的决策树顶端是一个树根,底部有许多的树叶,它将纪录分解成不同的子集,每个子集中的字段可能都包含一个简单的法则。此外,决策树可能有着不同的外型,例如二元 树、三元树或混和的决策树型态。</p>
<font color="red">4.遗传算法</font>
<p>遗传算法(Genetic Algorithm)学习细胞演化的过程,细胞间可经由不断的选择、复制、交配、突变产生更佳的新细胞。基因算法的运作方式也很类似,它必须预先建立好一个模式,再经由一连串类似产生新细胞过程的运作,利用适合函数(fitness function)决定所产生的后代是否与这个模式吻合,最后仅有最吻合的结果能够存活,这个程序一直运作直到此函数收敛到最佳解。基因算法在群集 (cluster)问题上有不错的表现,一般可用来辅助记忆基础推理法与类神经网络的应用。</p>
<font color="red">5.聚类分析</font>
<p>聚类分析(Cluster Detection)这个技术涵盖范围相当广泛,包含基因算法、类神经网络、统计学中的群集分析都有这个功能。它的目标为找出数据中以前未知的相似群体,在许许多多的分析中,刚开始都运用到群集侦测技术,以作为研究的开端。</p>
<font color="red">6.连接分析</font>
<p>连接分析(Link Analysis)是以数学中之图形理论(graph theory)为基础,藉由记录之间的关系发展出一个模式,它是以关系为主体,由人与人、物与物或是人与物的关系发展出相当多的应用。例如电信服务业可藉连结分析收集到顾客使用电话的时间与频率,进而推断顾客使用偏好为何,提出有利于公司的方案。除了电信业之外,愈来愈多的营销业者亦利用连结分析做有利于 企业的研究。</p>
<font color="red">7.OLAP分析</font>
<p>严格说起来,OLAP(On-Line Analytic Processing;OLAP)分析并不算特别的一个数据挖掘技术,但是透过在线分析处理工具,使用者能更清楚的了解数据所隐藏的潜在意涵。如同一些视觉处理技术一般,透过图表或图形等方式显现,对一般人而言,感觉会更友善。这样的工具亦能辅助将数据转变成信息的目标。</p>
<font color="red">8.神经网络</font>
<p>神经网络是以重复学习的方法,将一串例子交与学习,使其归纳出一足以区分的样式。若面对新的例证,神经网络即可根据其过去学习的成果归纳后,推导出新的结果,乃属于机器学习的一种。数据挖掘的相关问题也可采类神经学习的方式,其学习效果十分正确并可做预测功能。</p>
<font color="red">9.判别分析</font>
<p>当所遭遇问题它的因变量为定性(categorical),而自变量(预测变量)为定量(metric)时,判别分析为一非常适当之技术,通常应用在解决分类的问题上面。若因变量由两个群体所构成,称之为双群体 —判别分析 (Two-Group Discriminant Analysis);若由多个群体构成,则称之为多元判别分析(Multiple Discriminant Analysis;MDA)。<br>a. 找出预测变量的线性组合,使组间变异相对于组内变异的比值为最大,而每一个线性组合与先前已经获得的线性组合均不相关。<br>b. 检定各组的重心是否有差异。<br>c. 找出哪些预测变量具有最大的区别能力。<br>d. 根据新受试者的预测变量数值,将该受试者指派到某一群体。</p>
<font color="red">10.逻辑回归分析</font>
<p>当判别分析中群体不符合正态分布假设时,逻辑回归分析是一个很好的替代方法。逻辑回归分析并非预测事件(event)是否发生,而是预测该事件的机率。它将自变量与因变量的关系假定是S行的形状,当自变量很小时,机率值接近为零;当自变量值慢慢增加时,机率值沿着曲线增加,增加到一定程度时,曲线协 率开始减小,故机率值介于0与1之间。</p>
]]></content>
<summary type="html">
<p>在大数据时代,数据挖掘是最关键的工作。大数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程,也是一种决策支持过程。其主要基于人工智能,机器学习,模式学习,统计学等。通过对大数据高度自动化地分析,做出归纳性的推
</summary>
<category term="Python" scheme="http://hxbbing.github.io/categories/Python/"/>
<category term="Python" scheme="http://hxbbing.github.io/tags/Python/"/>
</entry>
<entry>
<title>训练集、验证集和测试集的意义</title>
<link href="http://hxbbing.github.io/2017/10/20/%E8%AE%AD%E7%BB%83%E9%9B%86%E3%80%81%E9%AA%8C%E8%AF%81%E9%9B%86%E5%92%8C%E6%B5%8B%E8%AF%95%E9%9B%86%E7%9A%84%E6%84%8F%E4%B9%89/"/>
<id>http://hxbbing.github.io/2017/10/20/训练集、验证集和测试集的意义/</id>
<published>2017-10-20T14:47:24.000Z</published>
<updated>2017-10-20T14:53:12.600Z</updated>
<content type="html"><![CDATA[<p>在有监督的机器学习中,经常会说到<strong>训练集(train)、验证集(validation)和测试集(test)</strong>,这三个集合的区分可能会让人糊涂,特别是,有些读者搞不清楚验证集和测试集有什么区别。</p>
<p>I. 划分</p>
<p>如果我们自己已经有了一个大的标注数据集,想要完成一个有监督模型的测试,那么通常使用均匀随机抽样的方式,将数据集划分为训练集、验证集、测试集,这三个集合不能有交集,常见的比例是8:1:1,当然比例是人为的。从这个角度来看,三个集合都是同分布的。<br>如果是做比赛,官方只提供了一个标注的数据集(作为训练集)以及一个没有标注的测试集,那么我们做模型的时候,通常会人工从训练集中划分一个验证集出来。这时候我们通常不再划分一个测试集,可能的原因有两个:<strong>1、比赛方基本都很抠,训练集的样本本来就少;2、我们也没法保证要提交的测试集是否跟训练集完全同分布,因此再划分一个跟训练集同分布的测试集就没多大意义了。</strong></p>
<p>II. 参数</p>
<p>有了模型后,训练集就是用来训练参数的,说准确点,一般是用来梯度下降的。而验证集基本是在每个epoch完成后,用来测试一下当前模型的准确率。因为验证集跟训练集没有交集,因此这个准确率是可靠的。那么为啥还需要一个测试集呢?</p>
<p>这就需要区分一下模型的各种参数了。事实上,对于一个模型来说,其参数可以分为<strong>普通参数和超参数</strong>。在不引入强化学习的前提下,那么普通参数就是可以被梯度下降所更新的,也就是训练集所更新的参数。另外,还有超参数的概念,比如网络层数、网络节点数、迭代次数、学习率等等,这些参数不在梯度下降的更新范围内。尽管现在已经有一些算法可以用来搜索模型的超参数,但多数情况下我们还是自己人工根据验证集来调。</p>
<p>III. 所以</p>
<p>那也就是说,<strong>从狭义来讲,验证集没有参与梯度下降的过程,也就是说是没有经过训练的;但从广义上来看,验证集却参与了一个“人工调参”的过程,我们根据验证集的结果调节了迭代数、调节了学习率等等,使得结果在验证集上最优。</strong>因此,我们也可以认为,验证集也参与了训练。</p>
<p>那么就很明显了,我们还需要一个完全没有经过训练的集合,那就是测试集,我们既不用测试集梯度下降,也不用它来控制超参数,只是在模型最终训练完成后,用来测试一下最后准确率。</p>
<p>IV. 然而</p>
<p>聪明的读者就会类比到,其实这是一个无休止的过程。如果测试集准确率很差,那么我们还是会去调整模型的各种参数,这时候又可以认为测试集也参与训练了。好吧,我们可能还需要一个“测试测试集”,也许还需要“测试测试测试集”…</p>
<p>算了吧,还是在测试集就停止吧。</p>
<p>转载自<a href="http://kexue.fm/archives/4638/" title="http://kexue.fm/archives/4638/" target="_blank" rel="external">http://kexue.fm/archives/4638/</a></p>
]]></content>
<summary type="html">
<p>在有监督的机器学习中,经常会说到<strong>训练集(train)、验证集(validation)和测试集(test)</strong>,这三个集合的区分可能会让人糊涂,特别是,有些读者搞不清楚验证集和测试集有什么区别。</p>
<p>I. 划分</p>
<p>如果我们自
</summary>
<category term="学术" scheme="http://hxbbing.github.io/categories/%E5%AD%A6%E6%9C%AF/"/>
<category term="学术" scheme="http://hxbbing.github.io/tags/%E5%AD%A6%E6%9C%AF/"/>
</entry>
<entry>
<title>Latex使用Visio画图</title>
<link href="http://hxbbing.github.io/2017/07/27/Latex%E4%BD%BF%E7%94%A8Visio%E7%94%BB%E5%9B%BE/"/>
<id>http://hxbbing.github.io/2017/07/27/Latex使用Visio画图/</id>
<published>2017-07-27T14:11:58.000Z</published>
<updated>2017-07-27T14:19:24.430Z</updated>
<content type="html"><![CDATA[<p>写论文的时候经常使用Visio来画图,然而用Latex排版论文的话,只能插入.eps格式的图片文件。怎么才能方便的插入图片呢?参考下面的文章:</p>
<p><a href="http://blog.csdn.net/kbawyg/article/details/8926113" target="_blank" rel="external">http://blog.csdn.net/kbawyg/article/details/8926113</a></p>
]]></content>
<summary type="html">
<p>写论文的时候经常使用Visio来画图,然而用Latex排版论文的话,只能插入.eps格式的图片文件。怎么才能方便的插入图片呢?参考下面的文章:</p>
<p><a href="http://blog.csdn.net/kbawyg/article/details/89261
</summary>
<category term="学术" scheme="http://hxbbing.github.io/categories/%E5%AD%A6%E6%9C%AF/"/>
<category term="学术" scheme="http://hxbbing.github.io/tags/%E5%AD%A6%E6%9C%AF/"/>
</entry>
<entry>
<title>为什么选择Python而不是Matlab</title>
<link href="http://hxbbing.github.io/2017/07/23/%E4%B8%BA%E4%BB%80%E4%B9%88%E9%80%89%E6%8B%A9Python%E8%80%8C%E4%B8%8D%E6%98%AFMatlab/"/>
<id>http://hxbbing.github.io/2017/07/23/为什么选择Python而不是Matlab/</id>
<published>2017-07-23T09:31:55.000Z</published>
<updated>2017-07-23T10:44:56.147Z</updated>
<content type="html"><![CDATA[<p>随着Python语言越来越火,功能越来越强大,使用的人越来越多,在实验室或者应用上都用的越来越多。我觉得是时候全力用上Python了。</p>
<p>放弃MATLAB!简述winpython为什么比MATLAB更方便:</p>
<p><a href="http://www.cnblogs.com/starimpact/p/3526146.html" title="放弃MATLAB!简述winpython为什么比MATLAB更方便" target="_blank" rel="external">http://www.cnblogs.com/starimpact/p/3526146.html</a></p>
<p><a href="http://www.open-open.com/lib/view/open1382927358390.html" title="Spyder" target="_blank" rel="external">http://www.open-open.com/lib/view/open1382927358390.html</a></p>
]]></content>
<summary type="html">
<p>随着Python语言越来越火,功能越来越强大,使用的人越来越多,在实验室或者应用上都用的越来越多。我觉得是时候全力用上Python了。</p>
<p>放弃MATLAB!简述winpython为什么比MATLAB更方便:</p>
<p><a href="http://www.
</summary>
<category term="Python" scheme="http://hxbbing.github.io/categories/Python/"/>
<category term="Python" scheme="http://hxbbing.github.io/tags/Python/"/>
</entry>
<entry>
<title>BIBTex制作参考文献</title>
<link href="http://hxbbing.github.io/2017/07/23/BIBTex%E5%88%B6%E4%BD%9C%E5%8F%82%E8%80%83%E6%96%87%E7%8C%AE/"/>
<id>http://hxbbing.github.io/2017/07/23/BIBTex制作参考文献/</id>
<published>2017-07-23T08:46:40.000Z</published>
<updated>2017-07-23T08:53:12.172Z</updated>
<content type="html"><![CDATA[<p>用latex写论文时,引用参考文献总是碰到各种各样的问题,我觉得这篇文章写得挺好,就拿过来分享给大家了。</p>
<p><a href="http://www.cnblogs.com/longdouhzt/archive/2012/06/21/2557965.html" title="BIBTex制作参考文献" target="_blank" rel="external">http://www.cnblogs.com/longdouhzt/archive/2012/06/21/2557965.html</a></p>
]]></content>
<summary type="html">
<p>用latex写论文时,引用参考文献总是碰到各种各样的问题,我觉得这篇文章写得挺好,就拿过来分享给大家了。</p>
<p><a href="http://www.cnblogs.com/longdouhzt/archive/2012/06/21/2557965.html" t
</summary>
<category term="学术" scheme="http://hxbbing.github.io/categories/%E5%AD%A6%E6%9C%AF/"/>
<category term="学术" scheme="http://hxbbing.github.io/tags/%E5%AD%A6%E6%9C%AF/"/>
</entry>
<entry>
<title>python conda学习</title>
<link href="http://hxbbing.github.io/2017/07/13/python-conda%E5%AD%A6%E4%B9%A0/"/>
<id>http://hxbbing.github.io/2017/07/13/python-conda学习/</id>
<published>2017-07-13T12:29:56.000Z</published>
<updated>2017-07-13T12:37:20.317Z</updated>
<content type="html"><![CDATA[<p>anaconda查看、安装、更新库</p>
<p><a href="http://blog.csdn.net/flyfrommath/article/details/68069344" title="anaconda查看、安装、更新库" target="_blank" rel="external">http://blog.csdn.net/flyfrommath/article/details/68069344</a></p>
<p>Google机器学习一 Anaconda 安装scikit-learn</p>
<p><a href="http://blog.csdn.net/tz_zs/article/details/73459800" title="Google机器学习一 Anaconda 安装scikit-learn" target="_blank" rel="external">http://blog.csdn.net/tz_zs/article/details/73459800</a></p>
]]></content>
<summary type="html">
<p>anaconda查看、安装、更新库</p>
<p><a href="http://blog.csdn.net/flyfrommath/article/details/68069344" title="anaconda查看、安装、更新库" target="_blank" re
</summary>
<category term="Python" scheme="http://hxbbing.github.io/categories/Python/"/>
<category term="Python" scheme="http://hxbbing.github.io/tags/Python/"/>
</entry>
<entry>
<title>研究生阅读和管理文献经验</title>
<link href="http://hxbbing.github.io/2017/07/04/%E7%A0%94%E7%A9%B6%E7%94%9F%E9%98%85%E8%AF%BB%E5%92%8C%E7%AE%A1%E7%90%86%E6%96%87%E7%8C%AE%E7%BB%8F%E9%AA%8C/"/>
<id>http://hxbbing.github.io/2017/07/04/研究生阅读和管理文献经验/</id>
<published>2017-07-04T03:34:40.000Z</published>
<updated>2017-07-04T03:36:20.154Z</updated>
<content type="html"><![CDATA[<p>说实在的,我自己也不是很会读书。读书的速度也不快,只是喜欢读书罢了。阅读文献,对于开题期间的研究生和写论文期间的研究生是很重要的功课,不可忽视,这种能力是需要训练的。关于做读书和文献阅读笔记,这里谈点个人的看法:</p>
<p>一 如何选择和阅读文献?</p>
<ol>
<li><strong>阅读文献,要力求对一个方面或一个主题,或者一个概念的历史发展都要搞清楚其来龙去脉。</strong>文献有新有旧,有些学科或专题文献的半衰期很长,经典文献的阅读是很重要的,只下载几篇新文献是很难理解全貌的。</li>
<li><strong>要有意识地阅读大家的文献,阅读某个领域或专题相关里程碑式的文献或文献综述。</strong>这些文献对于初学者了解一个学科或领域的发展是很有帮助的,对于某个阶段的重要文献提供了一个查找的捷径,从中可以很快了解一些相关理论、学说及重要结果的进展。</li>
<li><strong>要善于分析自己研究领域中一些国内外代表性实验室的论文。</strong>通过分析一个实验室的论文目录,可以了解这个实验室的发展过程和研究兴趣的发展和拓展。</li>
<li><strong>要善于分析本领域一些代表性学者的论文。</strong>通过分析这些引领学科或领域发展的科学家的论文目录,同样可以看到他(她)个人研究兴趣和研究生涯的发展,以及他(她)所领导的研究团队的发展过程。</li>
</ol>
<p>二 如何做文献阅读笔记呢?</p>
<ol>
<li><strong>在广泛阅读的基础上,要善于总结和整合,类似Minireview的方式。</strong>如果能将类似相近的一些重要文献(如10-20篇),进行整合和归纳,理出最新的几个专题的进展,无疑会加深对所阅读的文献的理解。那么笔记记什么?记录新进展。哪些是新进展?需要广泛阅读才能知晓。</li>
<li><strong>阅读任何文献或专著,一定要记录清楚文献题目、出处、作者、发表年代、期卷、页码等等信息。</strong>这些信息是以后引文时必须的,不要嫌麻烦,如作者栏目是需要将所有作者都要记录全的。 </li>
<li><strong>有些重要文献需要精读,读几遍是不行的,必须要读到很熟悉,不同阶段阅读都要把自己理解的内容记下来。</strong>这类文献在不同时期读有不同时期的理解:如开题阶段,可能比较注重某个方向或领域的理论和观点、实验方法和技术手段;在实验阶段,可能比较注意进行结果之间的比较,根据文献结果和变化规律,对自己的结果进行一些趋势预测;在论文写作阶段,可能会比较关注结果分析、理论学说的验证等等。与之相应,多数文献是需要泛读的,可能只需要读读题目,可能只看看摘要,也可能只浏览一下图表等等。</li>
<li><strong>要重视论文的题目和摘要,这是很重要、简洁与精炼的信息。</strong>一篇论文的精华部分都在这里了。同样文章中的一些重要信息也是需要特别关注的,如生态生理学特别关注物种对环境的适应,那么环境条件就是很重要的信息了,如物种的分类地位、生物学习性、地理分布,以及分布区的海拔、气候和植被等等。</li>
<li><strong>阅读文献和专著是需要积累的,多读多做笔记,要坚持不懈,多研究和教学工作恐怕一生都要坚持阅读新文献和著作,文献笔记宝典就是这么记成的。</strong>读文献有个量变到质变的过程,阅读量大了,积累多了,需要总结的方面就多了。这样日久天长,通过知识的整合,知识框架会逐渐完善,自己肚子里的“货”就会感觉逐渐充实起来了,用和取的时候就会很自如。</li>
<li><strong>从初学者到专家的转变,只要有心,只是一个时间问题。</strong>信息就是资源,知识就是信息的积累、过滤和整合。无论参加学术会议还是讨论会,有些人说了很多,占用很多时间,但你会感觉没有多少新的信息或知识。但有些人一开口,话不多,你马上就会感觉到人家肚子里知识的储备量,激烈争论的氛围会立即安静下来,听众会被吸引,这就是所谓的专家了。专家不是万金油。博士毕业后,我们都应该努力成为一个领域的准专家,再磨练积累几年,就一定会是名副其实的专家了。</li>
</ol>
<p>写了这么多,似乎还是有些空。我信奉的还是那句话:好记性不如烂笔头!该记的就要记,做学问,捷径不多。勤能补拙,书山有路勤为径嘛。还要记住“伤其十指,不如断其一指”的道理,如果兴趣太广,面面俱到,在信息时代,成为万金油是可能的,但要成为专家可就难了,要学会“舍”和“得”。</p>
<p>三 如何进行文献管理?</p>
<p>写论文、做研究需要查阅、下载和阅读很多文献,但是文献一旦很多,就难免失控,有时候往往需要花费半个小时去寻找一篇曾经看过的论文,花费时间也影响人的情绪,为什么不好好进行文献的管理呢?</p>
<p>下面是研究生进行文献管理的几个诀窍:</p>
<ol>
<li>下载电子版文献时(caj、pdf、html),把文章题目粘贴为文件名。注意,文件名不能含有特殊符号,要把\ / : * ? <>| 以及换行符删掉。每次按照同样的习惯设置文件名,可以防止重复下载。</li>
<li>不同主题存入不同文件夹。文件夹的题目要简短,如PD、LTP、PKC、NO等等。</li>
<li>看过的文献归入子文件夹,最起码要把有用的和没用的分开。</li>
<li>重要文献根据重要程度在文件名前加上001、002、003…这类编号,然后按名称排列图标,最重要的文献就排在最前面了。</li>
<li>复印或打印的文献,用打孔器(¥10-15)打孔,装入硬质文件夹(¥10-20/个)。</li>
</ol>
]]></content>
<summary type="html">
<p>说实在的,我自己也不是很会读书。读书的速度也不快,只是喜欢读书罢了。阅读文献,对于开题期间的研究生和写论文期间的研究生是很重要的功课,不可忽视,这种能力是需要训练的。关于做读书和文献阅读笔记,这里谈点个人的看法:</p>
<p>一 如何选择和阅读文献?</p>
<ol>
<
</summary>
<category term="学术" scheme="http://hxbbing.github.io/categories/%E5%AD%A6%E6%9C%AF/"/>
<category term="学术" scheme="http://hxbbing.github.io/tags/%E5%AD%A6%E6%9C%AF/"/>
</entry>
<entry>
<title>python27windows下三种安装第三方库的办法</title>
<link href="http://hxbbing.github.io/2017/07/04/python27windows%E4%B8%8B%E4%B8%89%E7%A7%8D%E5%AE%89%E8%A3%85%E7%AC%AC%E4%B8%89%E6%96%B9%E5%BA%93%E7%9A%84%E5%8A%9E%E6%B3%95/"/>
<id>http://hxbbing.github.io/2017/07/04/python27windows下三种安装第三方库的办法/</id>
<published>2017-07-04T03:28:55.000Z</published>
<updated>2017-07-04T03:32:01.858Z</updated>
<content type="html"><![CDATA[<p>python27 windows 下三种安装第三方库的办法</p>
<p>一、使用easy_install</p>
<p>C:\Python27\Scripts 下有 easy_install.exe 。例如我要安装 beautifulsoup,可以从 cmd 进入该目录,直接运行:</p>
<pre><code>easy_install beautifulsoup4
</code></pre><p>卸载库,可以用:</p>
<pre><code>easy_install -m beautifulsoup4 卸载所有依赖项
</code></pre><p>然后删掉包目录下方的 .egg 文件</p>
<p>更新包:</p>
<pre><code>easy_install --upgrade beautifulsoup4
</code></pre><p>二、使用 pip (推荐)</p>
<pre><code>pip install beautifulsoup4
pip uninstall beautifulsoup4
</code></pre><p>三、源码安装</p>
<p>下载函数库,解压,移动到 C:\Python27\Lib\site-packages\ 下,从cmd 进入函数库文件夹,运行:</p>
<pre><code>python setup.py build
python setup.py install
</code></pre><p>删除所安装的包,直接删除文件就好</p>
]]></content>
<summary type="html">
<p>python27 windows 下三种安装第三方库的办法</p>
<p>一、使用easy_install</p>
<p>C:\Python27\Scripts 下有 easy_install.exe 。例如我要安装 beautifulsoup,可以从 cmd 进入该目录,
</summary>
<category term="Python" scheme="http://hxbbing.github.io/categories/Python/"/>
<category term="Python" scheme="http://hxbbing.github.io/tags/Python/"/>
</entry>
<entry>
<title>Python数据分析必备之Matplotlib基础应用教程</title>
<link href="http://hxbbing.github.io/2017/07/04/Python%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90%E5%BF%85%E5%A4%87%E4%B9%8BMatplotlib%E5%9F%BA%E7%A1%80%E5%BA%94%E7%94%A8%E6%95%99%E7%A8%8B/"/>
<id>http://hxbbing.github.io/2017/07/04/Python数据分析必备之Matplotlib基础应用教程/</id>
<published>2017-07-04T03:25:31.000Z</published>
<updated>2017-07-04T03:27:08.973Z</updated>
<content type="html"><![CDATA[<p>1.瀑布图</p>
<pre><code>import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib.ticker import FuncFormatter
#Use python 2.7+ syntax to format currency
def money(x, pos):
'The two args are the value and tick position'
return "${:,.0f}".format(x)
formatter = FuncFormatter(money)
#Data to plot. Do not include a total, it will be calculated
index = ['sales','returns','credit fees','rebates','late charges','shipping']
data = {'amount': [350000,-30000,-7500,-25000,95000,-7000]}
#Store data and create a blank series to use for the waterfall
trans = pd.DataFrame(data=data,index=index)
blank = trans.amount.cumsum().shift(1).fillna(0)
#Get the net total number for the final element in the waterfall
total = trans.sum().amount
trans.loc["net"]= total
blank.loc["net"] = total
#The steps graphically show the levels as well as used for label placement
step = blank.reset_index(drop=True).repeat(3).shift(-1)
step[1::3] = np.nan
#When plotting the last element, we want to show the full bar,
#Set the blank to 0
blank.loc["net"] = 0
#Plot and label
my_plot = trans.plot(kind='bar', stacked=True, bottom=blank,legend=None, figsize=(10, 5), title="2014 Sales Waterfall")
my_plot.plot(step.index, step.values,'k')
my_plot.set_xlabel("Transaction Types")
#Format the axis for dollars
my_plot.yaxis.set_major_formatter(formatter)
#Get the y-axis position for the labels
y_height = trans.amount.cumsum().shift(1).fillna(0)
#Get an offset so labels don't sit right on top of the bar
max = trans.max()
neg_offset = max / 25
pos_offset = max / 50
plot_offset = int(max / 15)
#Start label loop
loop = 0
for index, row in trans.iterrows():
# For the last item in the list, we don't want to double count
if row['amount'] == total:
y = y_height[loop]
else:
y = y_height[loop] + row['amount']
# Determine if we want a neg or pos offset
if row['amount'] > 0:
y += pos_offset
else:
y -= neg_offset
my_plot.annotate("{:,.0f}".format(row['amount']),(loop,y),ha="center")
loop+=1
#Scale up the y axis so there is room for the labels
my_plot.set_ylim(0,blank.max()+int(plot_offset))
#Rotate the labels
my_plot.set_xticklabels(trans.index,rotation=0)
my_plot.get_figure().savefig("waterfall.png",dpi=200,bbox_inches='tight')
</code></pre><p>2.折线图</p>
<pre><code>import numpy as np
import matplotlib.pyplot as plt
x = np.arange(5)
y = np.random.randn(5)*2
plt.plot(x,y)
</code></pre><p>3.散点图</p>
<pre><code>import numpy as np
import matplotlib.pyplot as plt
x = np.arange(5)
y = np.random.randn(5)*2
plt.plot(x,y,'o')
</code></pre><p>4.直方图</p>
<pre><code>import numpy as np
import matplotlib.pyplot as plt
data = np.random.normal(1,10,1000)
plt.hist(data)
</code></pre><p>5.饼图</p>
<pre><code>import numpy as np
import matplotlib.pyplot as plt
x = ['a','b','c']
y = [100,200,300]
explode = (0.05,0,0)
plt.pie(y,explode=explode)
</code></pre><p>6.柱形图</p>
<pre><code>import numpy as np
import matplotlib.pyplot as plt
x= np.arange(0,20,5)
plt.bar(range(len(x)),x)
</code></pre><p>7.雷达图</p>
<pre><code>import numpy as np
import matplotlib.pyplot as plt
labels = np.array(['艺术A','调研I','实际R','常规C','企业E','社会S'])
#数据个数
dataLenth = 6
#数据
data = np.array([1,4,3,6,4,8])
angles = np.linspace(0, 2*np.pi, dataLenth, endpoint=False)
data = np.concatenate((data, [data[0]]))
angles = np.concatenate((angles, [angles[0]]))
fig = plt.figure()
ax = fig.add_subplot(111, polar=True)# polar参数!!
ax.plot(angles, data, 'bo-', linewidth=2)# 画线
ax.fill(angles, data, facecolor='r', alpha=0.25)# 填充
ax.set_thetagrids(angles * 180/np.pi, labels, fontproperties="SimHei")
ax.set_title("matplotlib雷达图", va='bottom', fontproperties="SimHei")
ax.set_rlim(0,10)
ax.grid(True)
</code></pre><p>8.箱型图</p>
<pre><code>import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
np.random.seed(2) #设置随机种子
df = pd.DataFrame(np.random.rand(5,4),
columns=['A', 'B', 'C', 'D'])#先生成0-1之间的5*4维度数据,再装入4列DataFrame中
df.boxplot() #也可用plot.box()
plt.show()
</code></pre><p>9.曲面图</p>
<pre><code>from matplotlib import pyplot as plt
import numpy as np
from mpl_toolkits.mplot3d import Axes3D
fig = plt.figure()
ax = Axes3D(fig)
X = np.arange(-4, 4, 0.25)
Y = np.arange(-4, 4, 0.25)
X, Y = np.meshgrid(X, Y)
R = np.sqrt(X**2 + Y**2)
Z = np.sin(R)
# 具体函数方法可用 help(function) 查看,如:help(ax.plot_surface)
ax.plot_surface(X, Y, Z, rstride=1, cstride=1, cmap='rainbow')
plt.show()
</code></pre>]]></content>
<summary type="html">
<p>1.瀑布图</p>
<pre><code>import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib.ticker import FuncFormatter
</summary>
<category term="Python" scheme="http://hxbbing.github.io/categories/Python/"/>
<category term="Python" scheme="http://hxbbing.github.io/tags/Python/"/>
</entry>
<entry>
<title>写在离开402之前</title>
<link href="http://hxbbing.github.io/2017/06/22/%E5%86%99%E5%9C%A8%E7%A6%BB%E5%BC%80402%E4%B9%8B%E5%89%8D/"/>
<id>http://hxbbing.github.io/2017/06/22/写在离开402之前/</id>
<published>2017-06-22T13:40:00.000Z</published>
<updated>2017-06-25T08:39:40.219Z</updated>
<content type="html"><![CDATA[<p>雨下的那么深下的那么认真,麻痹啊下了三天的雨了,在寝室窝了三天,人都快发霉了,这个时候开始心疼那些没有实验室整天待寝室搞学习(玩游戏)的了,看论文看得头疼,代码也不想写了,也找不到什么好看的视频,还是来写点东西吧~~~耐心看完,一点都不煽情,记流水账(hiahiahia~)</p>
<p>2017年6月22日,终于搬出402实验室了!!!<br>感觉做了一场梦,就这样的就要说声拜拜了,最近发生太多太多事,恰逢毕业离别的日子,似乎每个人的心里都有那么一股怨气与不爽,大概这就是操蛋的生活吧~看着人来人往,心中不免有些许惆怅,静不下心来冷静的思考,亦或许是有太多的时间来思考,直到思考变成了胡思乱想,心中不免思绪万千。</p>
<p>先放一张402实验室的合影,毕竟师兄师姐都毕业了,以后也基本上不可能聚这么齐了<br><img src="/2017/06/22/写在离开402之前/402.jpg" alt="logo"></p>
<p>工科楼前大合影<br>“还没有言别,你已消失在远方的地平线。我站着,如同一株小树那样平静。其次,我的心早已随你而去。不知你是否察觉。”<br><img src="/2017/06/22/写在离开402之前/4022.jpg" alt="logo"></p>
<p>402实验室内,人真的好多,只好站凳子上了<br><img src="/2017/06/22/写在离开402之前/402lab.jpg" alt="logo"></p>
<hr>
<p>记忆总是那么犹新,仿佛昨天才来到湘大一样。<br>朱自清说“燕子去了,有再来的时候;桃花谢了,有再开的时候;杨柳枯了,有再青的时候……”。但时间去了,再也没有回来的时候,就像研究生生活,已渐渐离我们远去。 <br><img src="/2017/06/22/写在离开402之前/hxb1.jpg" alt="logo"></p>
<p> 记得刚开始调剂来湘大的时候,从武汉赶过来复试,当时根本就没有抱太大希望,一是对这个学校对这里的一切都非常陌生,二是被考研折磨得身心俱疲。从武昌火车站一起跟几个贴吧认识的小伙伴往这边赶,路上还是蛮有意思的,一群互相不认识的人一起去一个未知的地方,还是挺兴奋的。到了湘潭火车站,我们几个准备打的,坐车实在是太累了,司机居然不打表。一路上我们都在试探着问湘大怎么样,湘大在他们本地人眼里怎么样,司机师傅也没多说什么,估计那几天都被问烦了,我们心里一点谱都没有~~二环线上司机开得贼快,妈的越拉越远,感觉好偏僻(那时二环路还没修好),难道要把我们拉到农村??终于到了,到了湘大南门,看到湘大南门几个字,放心了,没有把我们拐跑(当时合照找不到了)<br> 下车之后,跟小伙伴一一道别,我们就各自去找自己住的地方,从南门最左边那条路上去,快到联建了,打电话给住宿老板,费了一番功夫终于找到了,陆续有人来找住宿的地方都没有(幸好提前在网上订好了),等了半天,到我了他妈的男老板说要去另一个地方(当时还不知道是在东门,黑心老板),他开着车一路从现在的一田到图书馆到南苑到东坡村最后到东门,还一直往里面开,妈的东拐西拐,好远,我心里一直忐忑不安,一直在记路标,这万一把我绑架了或者要割我肾那不完了。到了住的地方了,还不错,居然有两张床,还有空调热水,还不贵。刚放下东西,小伙伴打电话说晚上一起吃饭,说去什么什么篮球场等她们。我一个人愣是凭着印象从东门最里面那条街走到了南苑球场,后来小伙伴说去现在的琴湖前面的羽毛球场,原来这一波小伙伴已经联系好了本校的一波小伙伴,带头的是个美女(后来还给我介绍女朋友来着^_^),终于找到了她们,不容易啊,出门靠朋友,虽然只是才认识,一个广东美女(她最悲剧了,其他几个调剂法学专业的都录取了,就她一个被刷了)提议去圆缘园吃饭,嘿嘿,吃饭的时候我们天南海北的谈,本校的小伙伴也很热情,后来建了一个群,感觉终于找到了组织,不再是一个人一样。吃完饭,本校那个美女说带我们去学校逛逛,从联建那条路上去(当时都没有土力院),吓死我了,那个地方没有灯,只有几道破墙,还很阴森,当时真的是不知道说什么,对这个学校都有点失望了,破破烂烂,一路逛啊逛逛到了信工院又逛到了法学院,后来自己一个人走回了东门,真的是远。晚上也没有休息好。<br> 第二天复试,搞得很快,好像只有政审、体检和听力测试,第三天也很快,专业笔试和综合面试,通知说下午一点钟左右出成绩发调档函,去领调档函的时候有个女生没有也就是被刷了,我倒是一点都不担心,无所谓了,不过还是找到我的了,拿到调档函之后在群里面跟其他小伙伴告别了就准备回武汉,真的跟永别一样,后来还是在网上确认了来湘大。</p>
<hr>
<p> 暑假提前来了实验室,自己主动联系了当时的导师李哲涛,他们实验室的小伙伴也帮我找好了10栋的住的地方,真的是好人多,导师说暑假要先学习强化本科的知识,待了一个星期左右,感觉实在是跟不上,吃不消,妈的感觉自己太弱了,而且实验室的研究方向也跟我想研究的不太契合。于是,我又重新联系了现在的导师叶松涛老师,给他发完邮件不到五分钟他就给我打电话过来了,我说我在寝室,他说你过来吧,于是下午我就去了402实验室,算是最早进实验室的,当时只有辉哥,栋哥,军哥和两位师姐在,妈的,好怂,都不敢说话。每天吃饭跟着师兄们混,去联建吃还要翻墙(当时那条路没修好),也是醉了。看看论文,写写代码,摸索着搭建分布式集群,然后被师兄师姐们带着打升级,每天过的还是挺充实的。很快辉哥也毕业了,要去澳洲了,大家经常一起聚餐什么的,师兄师姐们也都会带上我,对我挺好的,挺照顾我的。<br>辉哥毕业了~~<br><img src="/2017/06/22/写在离开402之前/hxb2.jpg" alt="logo"><br>送走辉哥(酸姐找男票去了,老是没有她)<br><img src="/2017/06/22/写在离开402之前/hxb3.jpg" alt="logo"></p>
<hr>
<p> 暑假学了一段时间,师兄师姐们都去九华了,留我一人在实验室也没意思,于是我就回家了。开学之后,知道真相的我眼泪掉下来啊,全是男的,尼玛研一的6个大老爷们开启了我们的幸福(搞基)生活,一个妹子都有!!!研一生活还是蛮轻松的,大部分时间都在上课(玩手机),看看论文,偶尔去找师兄师姐们玩。<br>说了好多次出去玩都没去成,唯一的组织的一次烧烤<br><img src="/2017/06/22/写在离开402之前/4.jpg" alt="logo"> </p>
<hr>
<p> 时光飞逝,转眼到了研二,突然间多了好多师弟师妹,同门也有几个去九华了,大家也开始忙碌起来了,除了学习偶尔也去九华找他们蹭饭吃,自己做饭就是香,还可以去科大骑骑小黄~<br><img src="/2017/06/22/写在离开402之前/5.jpg" alt="logo"><br><img src="/2017/06/22/写在离开402之前/6.jpg" alt="logo"> </p>
<hr>
<p> 美好的日子总是那么短暂,由于某些原因搬出402了。无论如何还是要感谢402的一切,毕竟在这里学习,在这里成长。<br>来一张工科楼的照片。<br><img src="/2017/06/22/写在离开402之前/gongkeloudeng.jpg" alt="logo"> </p>
<p>以后再也不会晚上十二点后从工科楼回寝室了<br><img src="/2017/06/22/写在离开402之前/7.jpg" alt="logo"> </p>
<p>周末也不会一起看电影了<br><img src="/2017/06/22/写在离开402之前/8.jpg" alt="logo"> </p>
<p>图书馆前的美景也不会再这么惬意的欣赏了,还是挺美的~~<br><img src="/2017/06/22/写在离开402之前/9.jpg" alt="logo"><br><img src="/2017/06/22/写在离开402之前/10.jpg" alt="logo"> </p>
<p>终于搬离402了,再看看大家<br><img src="/2017/06/22/写在离开402之前/11.jpg" alt="logo"><br><img src="/2017/06/22/写在离开402之前/12.jpg" alt="logo"><br><img src="/2017/06/22/写在离开402之前/13.jpg" alt="logo"> </p>
<p>哪怕现实打磨掉我们最锐意的棱角削弱我们的斗志压制我们曾经驿动的心仍希望在一个午后的小憩梦香中我们还挤坐在402里互相调侃说笑,这才是我们最纯粹的青春</p>
<p>不管外界环境怎样,希望大家不忘初心<br><img src="/2017/06/22/写在离开402之前/14.jpg" alt="logo"> </p>
<hr>
<p> 樱花落尽,仿佛秋天已经末路,池中荷花却盛开了这夏。爱笑的你开始收拾行囊,把这离别的味道也一并打包。总想再带走些什么,想带走那带不走的一切,时间低声叹息。衣袖轻挥,提醒了你那些已经深埋在心,无需泪水来证明。这是一个离别的季节,注定悲伤;这是一个感伤的季节,因为要离别。时间像沙漏一样看似细长,却又无时无刻不在流动。最后的时光,就这样在夏日的骄阳中,如水一般的蒸发掉,留给我们的只有昨天的美好记忆和明天对未来依旧的希望,而今天仍然生活在奋斗中。不记得年少时的轻狂,也不知道时光怎么在一眨眼间就走过了几个秋冬。我们从这里起航,走向遥远的地方。当我们走向明天,又怎能把昨日遗忘。回首昨日,那郁郁葱葱的日子。有过青涩,也有过芬芳,更有的是相遇相识相知。今天我们流泪了那可不是忧伤,那可不是遗失,是珍藏!</p>
<p> 又是一年毕业季,还未曾退去昨日的懵懂,就不知不觉被推向离别的十字交叉路口,不曾考虑过别离,就不得不挥手说再见。最不愿,亲见离愁,如今离别在眼前;最不堪,依稀往事,一切浮现如昨日。每个人都有一颗强大的心脏,可纳百川可撑万年船;然而,它又是如此的脆弱,甚至不堪承受离别之苦。当初,不止一次的幻想离开时会怎样的欢欣雀跃,直到这一天的到来,触及自己内心最脆弱的琴弦,才知道,其实不想走。也许,三年内,有成功,有失败。有欢笑,有泪水。其实,他们都有一个共同的名字叫做成长。<br> 今天的分别,会是下一次相聚的开始。也许多年以后,再回首,你我会为今天的某一个不经意的瞬间而感动。回忆,不会仅仅是酸涩的泪水和离别的愁绪,一如时间之琼酿,总是越陈越香。梦想的道路上,总会有不一样的风景,无须驻足,更不必留恋。吹尽岁月的黄沙,才会捡拾到生命之真金。 </p>
<p>愿多年离别归来时,你我尽是少年心。 </p>
<hr>
<p> 最后,再引用张爱玲在《半生缘》里的一句话:“<font color="red" size="3" face="“黑体”">我们都回不去了,世均。</font>”故事已经在转身的那一刻偃旗息鼓,即使十八年后重逢,也只得橡曼桢一样!微笑着,无奈着!再见了,我曾经的最美! </p>
<p>此刻,你应该为自己呐喊,为青春呐喊,不是青春万岁,而是“青春,我将在奋斗中走过,无怨无悔!”<br>加油吧,骚年!</p>
<p>给大家几个小小的建议: </p>
<font color="red" size="3" face="“黑体”"><br>1、不要过多在乎别人的看法,用宽容的心去原谅别人的过失,你要记住哲学中的一句话:“你在渡他”。<br><br>2、你若优秀,有人伸手进一步成就是你的福气;你若不优秀,就凭自己的能力慢慢进步,等你足够优秀时,自然会有人来成就你。<br><br>3、记住,你玩不了心计,但是你要有判断的能力,不要被耍了还在说别人的好。简单而又有智慧地生活更好。<br><br>4、是你的,这辈子都逃不掉,不是你的,要大方地放手,记住,在值得的人面前,你可以委屈自己。<br><br>5、不断学习,不断完善自己,记住学无止境这句话。<br><br>6、你已步入成人年龄,应该用成人的眼光来看待问题,并且以成人的要求来严格要求自己。<br><br>7、多说英语吧!对外交流必不可少。<br></font>
<p>再把最能激励我的一句话送给大家:</p>
<font color="red" size="3" face="“黑体”"><br>One of the chief differences between a successful mathematician and an also-ran is that the former takes his partial results and his tries—yes even his failures—and turns them into an attractive tapestry of theorems and corollaries and conjectures; and the latter instead takes two years of hard work and dumps it into trash. ———–Steven G Krantz<br></font>
<p>成功的数学家和其他的碌碌无为之辈的关键区别之一是:前者可以把他的结果、尝试乃至失败写成挂毯一般吸引人的定理、推论和猜想。而后者那些人会把两年的幸苦化为乌有。</p>
]]></content>
<summary type="html">
<p>雨下的那么深下的那么认真,麻痹啊下了三天的雨了,在寝室窝了三天,人都快发霉了,这个时候开始心疼那些没有实验室整天待寝室搞学习(玩游戏)的了,看论文看得头疼,代码也不想写了,也找不到什么好看的视频,还是来写点东西吧~~~耐心看完,一点都不煽情,记流水账(hiahiahia~)
</summary>
<category term="感想" scheme="http://hxbbing.github.io/categories/%E6%84%9F%E6%83%B3/"/>
<category term="感想" scheme="http://hxbbing.github.io/tags/%E6%84%9F%E6%83%B3/"/>
</entry>
<entry>
<title>数据科学家必备的工具与语言包</title>
<link href="http://hxbbing.github.io/2017/06/20/%E6%95%B0%E6%8D%AE%E7%A7%91%E5%AD%A6%E5%AE%B6%E5%BF%85%E5%A4%87%E7%9A%84%E5%B7%A5%E5%85%B7%E4%B8%8E%E8%AF%AD%E8%A8%80%E5%8C%85/"/>
<id>http://hxbbing.github.io/2017/06/20/数据科学家必备的工具与语言包/</id>
<published>2017-06-20T06:41:55.000Z</published>
<updated>2017-06-20T07:29:16.026Z</updated>
<content type="html"><![CDATA[<p>作为一位万人敬仰的数据科学家,不但需要培育一棵参天技能树,私人武器库里没有一票玩得转的大火力工具也是没法在江湖中呼风唤雨的。</p>
<p>近日北卡来罗纳大学CTO,一位数据科学家Jefferson Heard分享了多年来收集沉淀的数据分析工具集:</p>
<font color="#0099ff" size="4" face="黑体">1.处理较大、较复杂的类excel数据</font>
<ul>
<li>Pandas -处理tabular(类似Excel)数据的通用工具套件</li>
</ul>
<ul>
<li>SQLite – Tabular数据库格式,能够处理大规模数据集,同时也能在桌面环境运行</li>
</ul>
<ul>
<li>PostgreSQL – 企业级数据库系统</li>
</ul>
<font color="#0099ff" size="4" face="黑体">2.处理空间、地理数据</font>
<ul>
<li><p>PostGIS – Postgres的地理空间数据类型扩展</p>
</li>
<li><p>Carto – 地理空间数据的商业数据挖掘工具</p>
</li>
<li><p>Mapbox – 商业地图绘制工具,同时也是一个web地图系统</p>
</li>
<li><p>Leaflet – 基于网络资源和本地数据开发活动web地图的代码库</p>
</li>
<li><p>qGIS – 适用于几乎所有地理空间和地图绘制的图形化GIS工具</p>
</li>
</ul>
<font color="#0099ff" size="4" face="黑体">3.处理非常规数据</font>
<ul>
<li><p>RethinkDB – 处理实时数据流非常棒的数据库,正在从商业转开源,小心使用</p>
</li>
<li><p>MongoDB – 处理大规模非结构化和半结构化数据的流行数据库,应用于生产环境需要加小心</p>
</li>
</ul>
<ul>
<li>CouchDB – 与MongoDB有些类似但不尽相同</li>
</ul>
<ul>
<li>Cassandra – 图谱和关系数据库</li>
</ul>
<font color="#0099ff" size="4" face="黑体">4.为大规模数据集创建性能代码</font>
<ul>
<li>Pandas – Python下一个开源数据分析的库,它提供的数据结构DataFrame极大的简化了数据分析过程中一些繁琐操作</li>
</ul>
<ul>
<li>Apache Spark – 一个通用的高性能数据处理系统</li>
</ul>
<ul>
<li>SciPy and Numpy -可编写脚本的基于C的数值算法,能在紧凑的,底层机器数据架构上运行</li>
</ul>
<ul>
<li>Cython – 使用用C编译器的Python编译器,用来提升Python性能</li>
</ul>
<ul>
<li>PyOpenCL – 在图形显卡上进行数值计算和统计处理</li>
</ul>
<font color="#0099ff" size="4" face="黑体">5.数据清洗工具</font>
<ul>
<li>ODO – 在不同数据格式间进行转换的Python库</li>
</ul>
<ul>
<li>OpenRefine – 拥有图形用户界面的数据发现和清洗工具</li>
</ul>
<ul>
<li>Pandas – 数据科学任务中用来处理tabular数据的通用Python工具集</li>
</ul>
<ul>
<li>Scrapy – Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据</li>
</ul>
<ul>
<li>BeautifulSoup – 与Scrapy类似但不尽相同</li>
</ul>
<ul>
<li>Scrubadub – 去除个人身份信息</li>
</ul>
<ul>
<li>Arrow – 帮你轻松驾驭日期和时间戳的Python库</li>
</ul>
<ul>
<li>DataCleaner – 剔除脏数据的Python库</li>
</ul>
<ul>
<li>Dora – 与DataCleaner功能类似的Python库</li>
</ul>
<font color="#0099ff" size="4" face="黑体">6.数据可视化工具</font>
<ul>
<li>Processing – 交互式开发交互式可视化内容. 推荐读本:Visualizing Data</li>
</ul>
<ul>
<li>D3 – 在web上开发可视化交互</li>
</ul>
<ul>
<li>C3 – 来自D3的图表</li>
</ul>
<ul>
<li>Bokeh – 与D3类似, 但基于Python</li>
</ul>
<ul>
<li>matplotlib – 最早的Python数据可视化工具集</li>
</ul>
<ul>
<li>Leaflet – 一个为开发移动设备友好的互动地图的开源JavaScript库</li>
</ul>
<ul>
<li>MapBox -详见地图工具集</li>
</ul>
<ul>
<li>qGIS – 详见地图工具集</li>
</ul>
<ul>
<li>VTK – 在医疗、 和物理研究领域常用的重型可视化工具包</li>
</ul>
<font color="#0099ff" size="4" face="黑体">7.数据挖掘和机器学习工具</font>
<ul>
<li>Weka – 一个机器学习和数据挖掘工具包,这里有一本免费可读的参考书</li>
</ul>
<ul>
<li>SciKitLearn – 基于Python的机器学习和数据挖掘工具套件</li>
</ul>
<ul>
<li>Orange – 另一个基于Python的数据挖掘工具套件,同样拥有图形用户界面</li>
</ul>
<ul>
<li>TensorFlow – Google开源的多维度图谱数学建模工具</li>
</ul>
<font color="#0099ff" size="4" face="黑体">8.分享、协作以及知识管理工具</font>
<ul>
<li>Django -基于Python的web框架</li>
</ul>
<ul>
<li>Django REST Framework – 为Django网站创建 REST APIs</li>
</ul>
<ul>
<li>IRODS – 企业级数据存储和管理,包括元数据管理和基于规则的数据处理</li>
</ul>
<ul>
<li>Cassandra (useful for metadata and relationship storage) – 一个存储和查询元数据经常用到的开源分布式数据管理系统</li>
</ul>
<ul>
<li>GitLab -GitHub的开源替代品,可搭建私人服务器</li>
</ul>
<ul>
<li>ReciPy –</li>
</ul>
<ul>
<li>Prov – Python implementation of the W3C provenance model</li>
</ul>
<ul>
<li>Kanren (部署基于元数据和数据源信息的业务逻辑非常有用) – 一个描述性Python逻辑编程系统,非常适合科学元数据的查询和基于规则的处理</li>
</ul>
]]></content>
<summary type="html">
<p>作为一位万人敬仰的数据科学家,不但需要培育一棵参天技能树,私人武器库里没有一票玩得转的大火力工具也是没法在江湖中呼风唤雨的。</p>
<p>近日北卡来罗纳大学CTO,一位数据科学家Jefferson Heard分享了多年来收集沉淀的数据分析工具集:</p>
<font co
</summary>
<category term="统计学习方法" scheme="http://hxbbing.github.io/categories/%E7%BB%9F%E8%AE%A1%E5%AD%A6%E4%B9%A0%E6%96%B9%E6%B3%95/"/>
<category term="统计学习方法" scheme="http://hxbbing.github.io/tags/%E7%BB%9F%E8%AE%A1%E5%AD%A6%E4%B9%A0%E6%96%B9%E6%B3%95/"/>
</entry>
<entry>
<title>怎样做才是合格的研究生</title>
<link href="http://hxbbing.github.io/2017/06/17/%E6%80%8E%E6%A0%B7%E5%81%9A%E6%89%8D%E6%98%AF%E5%90%88%E6%A0%BC%E7%9A%84%E7%A0%94%E7%A9%B6%E7%94%9F/"/>
<id>http://hxbbing.github.io/2017/06/17/怎样做才是合格的研究生/</id>
<published>2017-06-17T13:32:03.000Z</published>
<updated>2017-06-19T08:35:57.220Z</updated>
<content type="html"><![CDATA[<p>研究生的招收与培养,是导师们永远关注的话题。撇开培养单位行政命令式的“硬指标”不说,那研究生达到什么程度才算合格呢?今天说说自己的理解。</p>
<p>首先把研究生大致分为三种类型:</p>
<p><strong>(1)想做科研,也能够做好科研。</strong></p>
<p>这类型需要的是知识的积累与能力的提高,假以时日,定会成功——不是指研究生一定会得到巨大的科学成就,而是指培养成为合格的毕业生。</p>
<p><strong>(2)想做科研,但不会做——愿望是好的,但缺乏能力。</strong></p>
<p>这一群体数量繁丰,特别需要导师给予良好的指导。当然,在获得必要知识储备和能力提高的同时,对科学问题的感悟可能也很重要。如此一来,这部分学生中,或许还存在一小部分不适合做科研的人。</p>
<p><strong>(3)根本不想做科研,当然一般也不会,更不用心。</strong></p>
<p>这一群体读研究生的目标明确——就是文凭!不过,这里并不乏适合做科研的脑袋!要想使他们中的一部分能够做科研、能够做好科研,需要导师的点化——这种点化不同于导师引导下对“科学问题”的感悟,而更像是对世界观、人生观和价值观的改造。</p>
<p>我一直认为,在培养学生做科研方面,不同层次有不同的目标。本科生学套路,硕士生学思想,博士生搞创新。</p>
<p>下面聊一聊俺对硕士生培养目标的理解,供大家商讨或拍砖。</p>
<p>这里就不讨论(1)类学生了,因为他们已经具备了硕士毕业的条件,只是个时间问题而已。至于(2)和(3)类学生,培养或提升的方面大致应该包括以下三个方面:</p>
<p><strong>第一,对已有理论知识的感知与应用。</strong></p>
<p>有一句成语叫“书读百遍其义自见”,有一条辩证规律是“量变引起质变”。</p>
<p>读研究生、学做科研,常规做法都是从阅读文献开始的。这里的文献不仅仅指从最新的相关期刊中查到的研究内容近似的文章,也包括研究课题可能涉及的理论与方法的书籍。许多研究生在阅读文章过程中,往往忽略对后者的重视。要清楚地知道,它们才是你今后攀登科学高峰的基石,而前者(期刊中的文章)仅仅是路标或甚至风景而已。</p>
<p>万丈高楼平地起,没有坚实的基础,你的学科知识体系即便不是空中楼阁,也会在未来的科研道路上一遇风雨就摇摇欲坠,令人胆战心惊的。</p>
<p>研究生们自己判断这方面的方法就是,能否真正正确理解导师给定的课题——即能够正确、有理、有据、准确回答这么几个简单的问题:课题的意义何在?或为什么要选择该课题?该课题目前存在什么样的问题或不足或研究空间?你有没有解决问题的思路与办法?在某些具体细节问题上,一般要超过导师对课题的了解。</p>
<p>如果到毕业时仍然不能做到这些,那么俺看似武断地告诉你:你不合格!</p>
<p><strong>第二,对实践手段、过程与结果的分析判断。</strong></p>
<p>在文献阅读做好的前提下,开始着手实践(大多数工科叫实验)过程的进行。这里注意两个概念的清晰内涵:科学性和合理性——至于正确性与准确性是有待于后人或时间检验的。</p>
<p>在评审论文的过程中,经常发现有人用“试验”二字;在与同行讨论问题,也有人建议用“试验”二字。鄙人认为甚是不妥。</p>
<p>《现代汉语词典》中这样解释:“实验”——为了检验某种科学理论或假设而进行某种操作或从事某种活动。“试验”——为了察看某事的结果或某物的性能而从事某种活动。</p>
<p>我认为“实验”有“有比较确定的预期目标并在科学理论指导下进行实际验证”之意,而“试验”更近于“不太清楚结果如何的试一试”的意思,有些“摸着石头过河——走一步算一步”的味道,当然这也不一定意味着“不科学”。如果汉语表达不清楚,我们可以借助于英语(呵呵,英语还有这个功能)。“实验”是Experiment(其实这个词中文释义中也有“试验”的意思),而“试验”更像是Try。再看看Experiment,与Expert有着同样的词根,是不是显得更“专业”些呢?</p>
<p>关于这方面的判断也有一个成语可以表达:熟能生巧!你在实践中“熟练”到了“巧”的程度吗?这里的“巧”是不同于“悟”的另一种境界。大家都学过《卖油翁》吧,老人家说“无他,唯手熟尔”,就是这种境界。如果至此还不理解,(俺不说你抬杠),再告诉你一个实例:研究或发明汽车的科学家,驾驶汽车的能力不一定超过出租汽车司机——根本原因在于一个“巧劲儿”!</p>
<p>还有一个就是合理性,最起码做到自圆其说。有人可能会说,仅仅合理不够,还必须正确与准确。其实这是不大可能的事。回想一下伟大的科学发现中的偶然性就知道了。</p>
<p>有人说科技论文只有20%是正确的,这是有道理的。不用说50~60%以上的正确率,就是超过30~40%以正确的“产出率”也够吓人的啦!对照工业企业的利润率来讲,20%的“利润”已经相当可观喽!</p>
<p><strong>第三,对获得实践结果的归纳、总结与凝练。</strong></p>
<p>这是对前两个方面程度的体现与输出,前两个方面的收获直接影响这部分的效果;而且即使前两个方面做得足够好,也不一定说明这部分一定没有问题;但是如果前两个方面做得不好,那这部分做得好者鲜有所闻。</p>
<p>这部分做起来很难,但判断比较容易。包括三个方面的内容:</p>
<p><strong>(1)学位论文(学生们称之为“大论文”)的编写。</strong><br>这是水平显示度最直接的方面。</p>
<p>如果发挥得好,甚至可以遮掩前两个方面的不足。如果把好好的一个科学问题或工程问题,写成一个简单实验结果的罗列与描述——本科生论文的味道。那你危险了!最起码说明你对研究课题的把握不够,没有能够达到融会贯通的境界。</p>
<p>说实在的,如果这个时候能够感悟到“文献阅读不足”所致还是要得的——“边学边卖”也许还来得及。如果到了这个时候连这个“感悟”都没有,那你完蛋喽,哈哈!</p>
<p><strong>(2)发表论文(学生们称之为“小论文”)的编写。</strong></p>
<p>这是研究工作或课题学术水平的最佳体现。这个方面既好把握,又不好把握。</p>
<p>说好把握,一方面是格式属于“八股文”类,照着现成的论文格式“套一套”即可。需要注意的倒是这方面最好不要“创新”,好论文因为格式不符合所投期刊的要求被拒者数见不鲜。另一方面内容已经摆在那里——现在一般都在计算机硬盘里装着。</p>
<p>不好把握的说法就是如何把内容有机的组装起来、把问题说明白、让读者看明白——这才是一个科学研究者的硬功夫。如果各方面配合得力(包括很给力的导师)的话,实现达到一篇SCI高度的论文对硕士生来讲,并非绝对不可能之事。</p>
<p>经常遇到的情况很可能是这样的:一个具有SCI高度Idea,只用了Ei高度的功力,最后写成了核心期刊水平的Paper。这恰似“播下龙种,收获跳蚤”的最新网络流行语——其非遗憾也欤?</p>
<p><strong>(3)做口头报告(学生们称之为“答辩”)音频的输出。</strong></p>
<p>有一个俗语叫“茶壶煮饺子——有嘴倒不出”。</p>
<p>有些方面,你内秀可以,做研究生论文不可以,而且绝对不可以!如果做得不好,那么对不起,你不合格。</p>
<p>宣讲论文与老师讲课不同。老师讲课目的是让听课者听懂并部分记忆,既不能以老师的科研水平做衡量的标准,更不能以老师当年的学习甚至考试水平做基准。</p>
<p>宣讲论文就是要体现自己的课题学术水平(包括创新性)、实验手段的先进性、结果或数据的真实性与合理性等,只要阐述明白即可。至于台下的人能否听明白,那不是答辩者的事儿!如果宣讲者自己讲着讲着把自己绕糊涂了(这可是司空见惯的哟),说明什么?——“短炼”!</p>
]]></content>
<summary type="html">
<p>研究生的招收与培养,是导师们永远关注的话题。撇开培养单位行政命令式的“硬指标”不说,那研究生达到什么程度才算合格呢?今天说说自己的理解。</p>
<p>首先把研究生大致分为三种类型:</p>
<p><strong>(1)想做科研,也能够做好科研。</strong></p>
</summary>
<category term="学术" scheme="http://hxbbing.github.io/categories/%E5%AD%A6%E6%9C%AF/"/>
<category term="学术" scheme="http://hxbbing.github.io/tags/%E5%AD%A6%E6%9C%AF/"/>
</entry>
<entry>
<title>关于论文写作那些事</title>
<link href="http://hxbbing.github.io/2017/06/10/%E5%85%B3%E4%BA%8E%E8%AE%BA%E6%96%87%E5%86%99%E4%BD%9C%E9%82%A3%E4%BA%9B%E4%BA%8B/"/>
<id>http://hxbbing.github.io/2017/06/10/关于论文写作那些事/</id>
<published>2017-06-10T13:43:44.000Z</published>
<updated>2017-06-19T08:42:10.683Z</updated>
<content type="html"><![CDATA[<pre><code>01 Research
</code></pre><p>research就好比人类走路。我们学会走路是一个由不熟练到熟练的过程。刚开始的时候跌跌撞撞,当尝试很多次后终于可以慢慢走,再熟练以后就可以快速奔跑了。research也是这样一个过程。只要我们朝着目标走,就会离目标越来越近。另外,人在走路时两条腿起着两个支撑的作用与科研中的两大能力相类比。走路时缺了哪条腿都不行。同样的,科研中缺了两大能力中的任何一个也不行。这两大能力分别是:<strong>实验能力、总结与陈述能力。</strong></p>
<p>作为理工科研究生,当有了idea以后,不知道如何设计实验、如何编写代码实现这个idea,则研究工作很难做下去。另一方面,总结与陈述能力也很重要。它包括会议报告与交流、科研论文和实验报告的撰写等。如果不会做总结与陈述,就不能较好的对实验现象做总结,也不利于学术观点的传播与交流。</p>
<pre><code>02 What is a good paper?
</code></pre><p>简言之,如果满足“立意高、文笔好、sell得好”就是一篇好文章。立意高,是指idea大。文笔好,就是要写得好。Sell得好,是指文章要投到合适的期刊。这一方面可以提高文章被录用的概率,另一方面可以提高被引用的概率,从而扩大影响力。</p>
<pre><code>03 Idea
</code></pre><p>Idea是有大小和层次之分的。可将其由大到小依次分为以下四类:</p>
<p>(1)对多年悬而未决的问题的突破性进展(理论、方法、技术)<br>(2)利用已有的理论、方法、技术解决关键科学问题,尤其是交叉领域的科学问题<br>(3)解决具体的理论或应用问题当中的结构、设计、算法和开发<br>(4)研发过程中的材料、工艺、算法等的微小改进</p>
<p>如果将所有的Idea看做一棵树,则这4类idea分别是树的根、干、枝、叶。相关的研究成果可以分别发表至Nature & Science、一区、二区、三四区SCI期刊上。</p>
<p>那么,这些ideas从何而来呢?</p>
<p>(1)理解和消化前人经验。这一过程的路线迁移为:检索—发现—总结—思考(洞察力)—创新。这需要有好的洞察力,既要能理解众多现象背后的普遍规律,又要具有批判性思维。我们需要从纵横两个维度处理这一过程。从横向看,该领域研究目前有几种方案?针对每种方案,目前的最新进展和认识是什么?哪种最为合理,后续的开展步骤是什么?从纵向看,每种方案提出的历史脉络如何?内部的思想沿革如何?每种方案的Top课题组是如何发现问题、解决问题的?</p>
<p>(2)寻求帮助。可以寻求来自导师等课题组成员、论文作者与团队的帮助。</p>
<p>(3)功夫在诗外。要做科研的有心人。在科研之外,脑袋里也要有科研这根弦。</p>
<pre><code>04 投哪去?
</code></pre><p>这是一个非常重要,但又容易忽略的一步。我们常常花了大半年,甚至一年来写一篇文章,但投文章可能只需要几个小时或一两天。在这一点上,我们需要花多点时间评估自身论文水平与类型。即:<strong>熟悉期刊样式与偏好、口味;尝试选择交叉领域期刊;是投Journal还是投letter?投稿时,最好投档次+1的期刊、会议。</strong></p>
<pre><code>05 怎么写?
</code></pre><p>首先,论文应具有原创性。有的期刊如果发现稿件中有连续6,7个词与其他论文相同,则会被判为抄袭。导致这种问题的原因主要有:应用模板、自我抄袭等。其次,从评审人的角度分析(1)评审人希望轻松而快捷得审稿,(2)评审人倾向于接收而不是拒绝稿件。这两点告诉我们,应该将文章写得清晰易懂,同时也要对自己有信心。</p>
<p>(1)<strong>Cover Letter</strong>。首段:包括期刊编辑姓名与文章标题。</p>
<p>Dear editor(如果确切知道编辑名称,可以直接写其名字)<br>Please find enclosed our manuscript entitled “论文标题” whichwe would like to submit for publication as a communication in期刊名.</p>
<p>第二段是重点。包括:<strong>Researchbackground,What was done and what was found(亮点与创新),Interest tojournal’s readers。</strong></p>
<p>第三段:<strong>投稿的道德规范免责说明</strong>:The work described has not been submitted elsewhere for publication,in whole or in part, and all the authors listed have approved the manuscriptthat is enclosed.<strong> 信件的格式进行署名</strong>:If you have any queries, please don’t hesitate to contact us at theaddress below. <strong>署名</strong>(通讯作者+地址、联系方式)</p>
<p>(2)<strong>Title</strong>。Title的意义主要在于:对评审人而言,会留下论文的第一印象:新方法、新技术、新算法、新应用…;会判断是否适合自己评审(领域);是否会从中受益(亮点)等。从写作者的角度,则是:用以点明研究领域与贡献;应该选择更高被引几率的关键词;要采用多种方式吸引眼球(Keys of Title)。标题的关键点在于:创新点与贡献要突出,放在最前面;关键词要斟酌(至少要包括两个点:特点和所在领域);形容词和数字表现亮点;采用动宾结构会使人印象深刻。</p>
<p>(3)<strong>Abstract</strong>。此部分是写作的关键点。其意义在于:从评审与读者的角度看:有利于快速了解论文内容;判断文章质量与难度、亮点与创新。从写作角度看:可强调本文(而非他人)的<strong>贡献</strong>与结果(而非问题)的<strong>重要性</strong>;便于搜索,以提高引率。</p>
<p>Abstract的架构包括4个部分——</p>
<p>Part1:本文的主题与解决的问题(扣题);<br>Part2:问题怎么解决的?(方法);<br>Part3:具体的结果与亮点(创新之处);<br>Part4:达到的效果与影响。</p>
<p>(4)<strong>Structure& Subtitle(The sketch of our whole paper)</strong>。从评审与读者角度看,这部分可以体现研究内容的内在逻辑性;易于快速定位,便于阅读。在写作角度,这部分相当于草图,有了草图才好盖房子;另外,还可以起到重复亮点与创新点,强化<strong>贡献</strong>的效果。该部分的架构通常为:</p>
<p>Part1:Introduction;<br>Part2:Theory ;<br>Part3:Methodology<br>3.1/3.2/3.3…;<br>Part4:Results and discussion;<br>Part5: Conclusion。</p>
<p>对Part3 Methodology部分的子标题的要求为:篇幅详略得当:对于比较繁琐的推导等内容可放在附录、参考文献中;逻辑完整:即<strong>A whole story</strong>;多方面的贡献要考虑拆分;Subtitle中要考虑重复题名与关键词;句法结构相同。另外,对于主旨句,通常为第一句,要清晰,不含糊。</p>
<p>(5)<strong>Introduction(The guide)</strong>。这部分对评审与读者而言,意义在于:扫除背景盲区,迅速聚焦主题范围;提出问题,并给出解决方案;呼应title和abstract。从写作的角度,体现了对研究背景与他人工作的综合概括能力;目的是提出问题以引出<strong>亮点与创新点</strong>,强化贡献;可提高评审与读者对文章主体部分的阅读预期。这一部分最好不要有标题清单。</p>
<p>这部分的焦点是:有哪些问题?有什么创新点?具体包括:和别的方案比较,新颖性、有效性?是最好的方案?对于解决哪些方面有用?为什么要关注?</p>
<p>(6)<strong>Conclusion</strong>。从评审与读者的角度,这部分的意义在于:在结尾中对比引言与论文主题的相关论述;比摘要更详细的了解本文贡献,以确定拒稿/修改(评审)或有无用处(读者)。在写作角度,可以再一次突出<strong>贡献及影响力</strong>;强调其它可以开展的工作或研究方向。</p>
<p>这里还需要说明的是:Conclusion与Abstract& Introduction的区别。一是时态,Abstract中用现在时,Conclusion中要用过去时。二是内容,用简单的两句话说明了二者的不同。Introduction:the worldwithout me;Conclusion: The improved world with my help! 这两大区别确实不容易搞清楚。</p>
<p>(7)<strong>Response tothe reviewers(题外话)</strong>。基本原则是:态度友善,用词和缓;回答问题层次分明,抓住重点;有理有据:补充图、数据或相关描述。推荐格式:point-to-point,即:点对点的回复。</p>
<p>(8)<strong>Acknowledgement(题外话)</strong>。感谢任何个人或机构在技术实现过程中的帮助,如:提供仪器、设备或相关实验材料;提供有益的启发、建议、指导、审阅,承担某项辅助性工作。感谢外部的基金帮助,如:资助、协议或奖学金,需要附注资助项目号。</p>
]]></content>
<summary type="html">
<pre><code>01 Research
</code></pre><p>research就好比人类走路。我们学会走路是一个由不熟练到熟练的过程。刚开始的时候跌跌撞撞,当尝试很多次后终于可以慢慢走,再熟练以后就可以快速奔跑了。research也是这样一个过程。只要我们朝着目标
</summary>
<category term="学术" scheme="http://hxbbing.github.io/categories/%E5%AD%A6%E6%9C%AF/"/>
<category term="学术" scheme="http://hxbbing.github.io/tags/%E5%AD%A6%E6%9C%AF/"/>
</entry>
<entry>
<title>Ubuntu下配置SSH以支持putty登录</title>
<link href="http://hxbbing.github.io/2017/05/29/Ubuntu%E4%B8%8B%E9%85%8D%E7%BD%AESSH%E4%BB%A5%E6%94%AF%E6%8C%81putty%E7%99%BB%E5%BD%95/"/>
<id>http://hxbbing.github.io/2017/05/29/Ubuntu下配置SSH以支持putty登录/</id>
<published>2017-05-29T08:59:32.000Z</published>
<updated>2017-05-29T09:07:11.005Z</updated>
<content type="html"><![CDATA[<p>1.Ubuntu安装SSH</p>
<p>命令: # sudo apt-get install openssh-server</p>
<p>2.确认sshserver是否安装好</p>
<p>命令:ps -e | grep sshd</p>
<p>3.启动SSH Server</p>
<p>命令:#sudo /etc/init.d/ssh start</p>
<p>4.修改ssh的端口默认是22</p>
<p>/etc/ssh/sshd_config</p>
<p>5.重启ssh服务</p>
<p>命令: /etc/init.d/ssh restart</p>
<p>参考:<br><a href="http://blog.csdn.net/doniexun/article/details/45268365" title="Ubuntu14.04下配置SSH以支持远程putty登录" target="_blank" rel="external">http://blog.csdn.net/doniexun/article/details/45268365</a></p>
]]></content>
<summary type="html">
<p>1.Ubuntu安装SSH</p>
<p>命令: # sudo apt-get install openssh-server</p>
<p>2.确认sshserver是否安装好</p>
<p>命令:ps -e | grep sshd</p>
<p>3.启动SSH Serve
</summary>
<category term="Ubuntu" scheme="http://hxbbing.github.io/categories/Ubuntu/"/>
<category term="Ubuntu" scheme="http://hxbbing.github.io/tags/Ubuntu/"/>
</entry>
<entry>
<title>读研压力很大?那么你必须有所突破了</title>
<link href="http://hxbbing.github.io/2017/05/29/%E8%AF%BB%E7%A0%94%E5%8E%8B%E5%8A%9B%E5%BE%88%E5%A4%A7%EF%BC%9F%E9%82%A3%E4%B9%88%E4%BD%A0%E5%BF%85%E9%A1%BB%E6%9C%89%E6%89%80%E7%AA%81%E7%A0%B4%E4%BA%86/"/>
<id>http://hxbbing.github.io/2017/05/29/读研压力很大?那么你必须有所突破了/</id>
<published>2017-05-29T03:19:09.000Z</published>
<updated>2017-05-29T03:24:00.921Z</updated>
<content type="html"><![CDATA[<p>一、英文阅读的障碍</p>
<p>刚接触研究的人最头疼看英文文献,总是读中文资料,理由是英文看不懂。那么中文就能看懂了吗?不见得,只不过是能认识中文字而已,懂不懂实际上与什么语言一点关系都没有。并不是说中文文献不能看,当然也不是崇洋媚外,问题在于中文资料中的概念往往不准确,经常出现以诈传诈的现象(中国素有天下文章一大抄之说)。对于接受新知识来说,第一眼很重要,如果第一次接受的不准确,以后再想改就难了。最准确的东西到哪儿去找?原始文献以及对原始文献的跟踪!往往原始文献都是英文的,你不读英文,显然不行。想要搞研究,就非要突破这一关口不可。有啥窍门么?没有,只能硬头皮读,一遍两遍三遍的读!到啥程度才算突破了呢?当你的眼睛能变成机关枪“扫射”英文文献时,基本就OK了。当然,从经常卡壳的鸟枪到机关枪,必是一个痛苦的升级过程。 </p>
<p>二、与老板沟通的障碍</p>
<p>研究生与老板基本上是合作关系,要合作愉快就必须有良好的沟通,包括工作上的沟通及生活上的沟通,毕竟谁也不是工作机器。有的学生自恃甚高,把老板的话或者当耳旁风,或者敷衍了事;有的学生极度自卑,害怕老板检查工作进度,害怕老板给穿小鞋而惶惶不可终日。这两个极端都不好,但往往陷入其中无法自拔者甚众。实际上所有老板深知学生的重要,他怎么会害怕学生超过自己呢?高兴还来不及呢!他怎么可能会故意和学生过不去呢?之所以有问题,大都是无法沟通所致。及时沟通是保证工作顺利、生活开心的法宝。到啥程度才算通畅呢?当你能把老板不当老板看时,就算过关。 </p>
<p>三、对未来患得患失的障碍</p>
<p>在两三年的研究生涯中,思考最多的问题恐怕就是能否毕业及毕业后干啥这两个,从研一恐怕就开始了如此反反复复的思考。不自觉地就会怀疑现在做的研究对将来工作有没有用?即使做了能有啥好处呢?所以我看到很多学生的笔记本上不是科研思考记录,而是诸如证书、考级、面试、招聘等等信息。担心未来是人之常情,但很多人忽略了一个事实:未来是建立在你眼前工作基础之上的,也就是说,将来的好坏,完全由你现在工作的优劣所决定。如果你抛弃现在手边的事而追求未来,哪怕是两三年的未来,基本上是舍本求末,本末倒置,直到最后落个两耽误。因此,突破对未来的恐惧十分必要。如何才算突破呢?当你能专心于手头上的事而不走神,能超过45分钟,就算合格。</p>
<p>唉,这年头谁能没点压力呢?面对你的本职工作,喜欢也好,讨厌也罢,生活总是要继续,工作仍然要前进,如果不能及时突破这些关口,时光稍纵即逝,贻误了战机,这世上可没有卖后悔药的哦(至少现在还没有,突破光速、时光倒流,今天还只是个猜测)。</p>
]]></content>
<summary type="html">
<p>一、英文阅读的障碍</p>
<p>刚接触研究的人最头疼看英文文献,总是读中文资料,理由是英文看不懂。那么中文就能看懂了吗?不见得,只不过是能认识中文字而已,懂不懂实际上与什么语言一点关系都没有。并不是说中文文献不能看,当然也不是崇洋媚外,问题在于中文资料中的概念往往不准确,
</summary>
<category term="学术" scheme="http://hxbbing.github.io/categories/%E5%AD%A6%E6%9C%AF/"/>
<category term="学术" scheme="http://hxbbing.github.io/tags/%E5%AD%A6%E6%9C%AF/"/>
</entry>
<entry>
<title>maven学习</title>
<link href="http://hxbbing.github.io/2017/05/20/maven%E5%AD%A6%E4%B9%A0/"/>
<id>http://hxbbing.github.io/2017/05/20/maven学习/</id>
<published>2017-05-20T02:36:21.000Z</published>
<updated>2017-05-20T02:39:38.705Z</updated>
<content type="html"><![CDATA[<p>这几天在学习maven,记录一下:</p>
<p>Eclipse4.6(Neon) + Tomcat8 + MAVEN3.3.9 + SVN项目完整环境搭建:</p>
<p><a href="http://www.cnblogs.com/oucbl/p/5928511.html" title="Eclipse4.6(Neon) + Tomcat8 + MAVEN3.3.9 + SVN项目完整环境搭建 " target="_blank" rel="external">http://www.cnblogs.com/oucbl/p/5928511.html</a></p>
<p>eclipse创建maven项目 动态web工程完整示例:</p>
<p><a href="http://www.cnblogs.com/noteless/p/5213075.html" title="eclipse创建maven项目 动态web工程完整示例 " target="_blank" rel="external">http://www.cnblogs.com/noteless/p/5213075.html</a></p>
]]></content>
<summary type="html">
<p>这几天在学习maven,记录一下:</p>
<p>Eclipse4.6(Neon) + Tomcat8 + MAVEN3.3.9 + SVN项目完整环境搭建:</p>
<p><a href="http://www.cnblogs.com/oucbl/p/5928511.ht
</summary>
<category term="maven" scheme="http://hxbbing.github.io/categories/maven/"/>
<category term="maven" scheme="http://hxbbing.github.io/tags/maven/"/>
</entry>
<entry>
<title>Python学习一</title>
<link href="http://hxbbing.github.io/2017/05/15/Python%E5%AD%A6%E4%B9%A0%E4%B8%80/"/>
<id>http://hxbbing.github.io/2017/05/15/Python学习一/</id>
<published>2017-05-15T12:22:07.000Z</published>
<updated>2017-05-15T12:29:29.858Z</updated>
<content type="html"><![CDATA[<p>Ipynb文件的打开</p>
<p><a href="http://blog.csdn.net/Gavin__Zhou/article/details/52574843" title="Ipynb文件的打开" target="_blank" rel="external">http://blog.csdn.net/Gavin__Zhou/article/details/52574843</a></p>
]]></content>
<summary type="html">
<p>Ipynb文件的打开</p>
<p><a href="http://blog.csdn.net/Gavin__Zhou/article/details/52574843" title="Ipynb文件的打开" target="_blank" rel="external">h
</summary>
<category term="Python" scheme="http://hxbbing.github.io/categories/Python/"/>
<category term="Python" scheme="http://hxbbing.github.io/tags/Python/"/>
</entry>
<entry>
<title>Python方向</title>
<link href="http://hxbbing.github.io/2017/05/08/Python%E6%96%B9%E5%90%91/"/>
<id>http://hxbbing.github.io/2017/05/08/Python方向/</id>
<published>2017-05-08T07:28:06.000Z</published>
<updated>2017-05-08T07:30:55.690Z</updated>
<content type="html"><![CDATA[<p>学习Python可以做哪些事,来盘点一下:</p>
<p>web全栈、数据分析和网络爬虫</p>
<p>基于Django框架的电商网站平台、基于Tornado框架的移动o2o应用</p>
<p>分布式爬虫和数据分析、深度学习</p>
]]></content>
<summary type="html">