免责声明:网站内容仅供个人学习记录,禁做商业用途,转载请注明出处。

版权所有 © 2017-2020 NEUSNCP个人学习笔记 辽ICP备17017855号-2

利用LFR Benchmark 生成带标签的网络数据集

现实世界中,获取大规模带标签的网络数据集比较困难。当然,不排除斯坦福的SNAP [1] ,Newman大牛的个人主页 [2] 等给出了很多有价值的数据集。但是,如果想要构建符合自己需求的带有 ground truth的数据集就比较困难了。复杂网络领域的另一位大牛,Santo Fortunato [3] , 给出了一个Linux版本的程序,可以根据参数配置生成比较理想的数据集。下载地址: LFR Benchmark 使用方法: 命令: .\benchmark.exe -N 1000 -k 15 -maxk ...

继续阅读 »
分享到:

给“实体抽取”打补丁

在邮箱场景中,光抽取人名是不够的,你要知道对应到具体人名类型的哪个实体,发件人,收件人,还是抄送人,等等 BiLSTM-CRF,就算是BERT-BiLSTM-CRF也不一定能够保证,在语料训练不够充分的情况下,能够精准的识别,这时候,往往要有补救措施,有的时候,最直接直白,简单的方式,在没有很好的办法下,在实践中往往可以尝试采纳,等待新技术有所突破,再替换 现在采用的笨方法,就是根据自然语言依存分析,找到语句结构的dependency,分析主谓宾,以谓语为主要识别点,进行语义识别,应为具体识别,往往是通过...

继续阅读 »
分享到:

LaTex 编译莫名奇妙的报错及常见技巧

LaTex编译时候报错:The operation could not be completed for the following reason: 解决办法:卸载,重装最新版 MikTex 报错提示:C:\Program Files\MiKTeX 2.7\miktex\bin\dvips.exe: ! Couldnt find font file mtsy.pfb"" 原因:可能使用了商业字体mathtime, 注释掉这一行即可。 See also: https://latex.org/forum/vi...

继续阅读 »
分享到: