博客 - NEUSNCP

The Python Challenge爬塔记录0—2

2018-11-13 09:19 sunmengqi

最近一直在 The Python Challenge 网站爬塔， The Python Challenge 是个很有意思的小网站，具体介绍见百度链接 https://baike.baidu.com/item/Python%20Challenge/6234024?fr=aladdin 网站或网址是 http://www.pythonchallenge.com/ ，有兴趣的同学可以一起来爬塔。闲话少说，进入上述网址之后，就可以看到画风清奇的网站主页面，如下图。然后点...

继续阅读 »

分享到：

聚类算法_kmeans

2018-09-10 20:39 不穿秋裤的南方人

最近开始学习NRL，其中需要用sklearn包中的聚类算法，结合网上的博客，尝试做了做程序源码： import numpy as np from sklearn.cluster import KMeans import matplotlib.pyplot as plt def kmeans_building(x1, x2, types_num, types, colors, shapes): X = np.array(list(zip(x1, x2))).reshape(len(x1), 2) # 设置...

继续阅读 »

分享到：

新浪微博爬虫实践

2018-08-29 13:48 hxy

最近想要获取一些真实社交网络的数据，试了试Facebook for developers, 提供了很完善的接口： https://developers.facebook.com/tools/explorer/ 但是从2018年4月4日之后，停止了friendlists的功能。有点可惜。并且，在服务器上暂时无法访问Facebook，在看看Google+的api: https://developers.google.com/+/web/ 测试了一下get方法，我的id是101266749844321077...

继续阅读 »

分享到：

Normalized Mutual Information 的Python 实现 (NMI.py)

2018-11-19 20:38 hxy

NMI是Normalized Mutual Information的简称，用于比较社团划分结果与ground-truth之间的接近程度，取值范围为[0, 1]，出自2006年 Danon 的论文 [1]。有两种计算方法，为了方便大家检测结果，写了一个通用的Python版计算函数，当然也可以直接调用库函数计算。代码如下： # -*- coding: utf-8 -*- import math def NMI(c1, c2): ''' Calculate Normalized Mutual Informati...

继续阅读 »

分享到：

Python实践 - 多线程(1)

2018-07-14 21:28 rick

Python实现多线程批量执行任务当批量任务出现时, 多线程执行总是更好的选择, Python为我们提供了threading这个包方便我们创建和管理自己的线程 # 时间辅助函数 def dateToStr(dt): if type(dt) == datetime.datetime: return datetime.datetime.strftime(dt, '%Y-%m-%d') if type(dt) == str: return dt return None def dateToDate(dt): ...

继续阅读 »

分享到：

NEUSNCP

643

Error

The Python Challenge爬塔记录0—2

聚类算法_kmeans

新浪微博爬虫实践

Normalized Mutual Information 的Python 实现 (NMI.py)

Python实践 - 多线程(1)