CNN通常是用于图像处理,因为CNN的结构与图像处理领域的卷积核很相似,在处理二维的图像数据时可以有效提取图像特征。为什么也可以用到自然语言处理当中呢?自然语言处理当中,有n-gram模型,用于统计某几个连续的词语序列出现的概率。当观察到前几个单词依次出现时,可以返回在训练语料库中接着出现最多,概率最大的单词。这里的n表示连续的单词数量,通常取2到4个,更多的训练起来就很稀疏了。如果我们使用一维的卷积核对词语序列进行训练,也可以类似的捕捉到词语序列的特征。比如:狼来了,分别用2, 1, 3的实数向量表示狼,来,了。当卷积核m是[1, 2, 3]的时候就比[-3, -2, 1]与词向量相乘...
使用场景在自然语言处理中,需要对词语进行表示。在语料当中,词典通常都是非常大的,如果使用 one-hot 的格式来表示,会有巨大的维度,显得稀疏,并且词语之间的关系并没有表示出来。这时候,会使用一个低维度(通常是300维度)的矩阵来表达词典,通过查询的方式得到某个词语的向量来表示这个词语。上图表格中包含一个矩阵E,每个词语的词向量可以通过该词语的id编号,比如Apple(456),查询该矩阵当中456列的向量 [0.00, -0.01, 0.03, 0.95] 即为该词语的词向量,低频不在词典当中的词语被认为是Unkown.
这种方式有几个优点:
降低了词语的维度,提高运算效率;
...
在服务器上安装Neo4j连接服务器时没有图形界面与浏览器,需要在shell中下载与安装Neo4j.在shell中使用wget下载
1wget http://dist.neo4j.org/neo4j-community-${NEWVERSION}-unix.tar.gz
NEWVERSION是你需要下载的Neo4j版本号,版本号的列表可以从这个网址中得到。
依照官网的指导来安装Neo4j
下载安装包,在上一步当中已经完成。
使用命令解压安装包,解压的顶层目录称为。 NEO4J_HOME
1tar -xf <filename>
进入NEO4J_...
这是一场主题为知识图谱的学术讨论会,会议通知
知识图谱前沿课程介绍作为组织方的北理工大数据学习中心做开场白,介绍了这几年,北理工在大数据学习方面的努力,系列课程、讲座,同学们的自组织学习以及成果展示。也预告了今年的教学安排。觉得在北理工的学习环境挺好的,有点羡慕呀。
知识图谱与认知智能主讲人:肖仰华@复旦大学计算机学院肖老师的讲解偏向背景介绍,介绍了这场讨论的主题,引入了为什么要做知识图谱的研究,穿插介绍了其他嘉宾的话题与知识图谱的关系。还介绍了复旦知识工场的工作。
计算智能–>感知智能–>认知智能
计算智能指规则明确特定领域的数据分析优化,感知智能指类似人的...