论文笔记：PTE: Predictive Text Embedding through Large-scale Heterogeneous Text Network

PTE: Predictive Text Embedding through Large-scale Heterogeneous Text Network

和前几篇目标函数差不多。

步骤

建立异构网络

如下图，通过文本建立起来的网络分为三部分
（1）word-word，每一个word是一个顶点，边上的权重是两个word同时出现的次数。
（2）word-document，word和document是顶点，边是这个word出现在这个文本中的次数。
（3）word-label，这里的label是document的label，label和word是顶点，边上的权重是这个word出现在属于这个label的document的篇数。

embedding

embedding的目标函数是second-order proximity，其实目标就是在网络中出现的近的点在嵌入后的向量越相似。
首先，两个顶点的相似度：

对word-word学习的时候的目标函数：

这里是kl散度。入是顶点vj在网络中的重要性，可以通过度数来得到，目的是为了使得先验概率和学习的概率更相似，这里的先验概率：

通过kl-散度的到目标函数：

因此对于整个网络，含有三个组成部分来说，整体的目标函数是三部分之和：

训练

有两种方法：

同时学习，就是有无标签无所谓，按照建立的网络和目标函数一起学习
pre-training and fine-tuning：看算法2，线训练w-w和w-d，再训练含有标签的w-l

总结

论文的目标函数不是特别新颖，使用了KL-散度，很多论文都这么做。
但是论文建立的网络比较新颖，建立了含有多种关系的异构网络，并且运用了标签，部分可以监督。

使用anaconda安装tensorflow部分问题及解决方案

文章目录安装概述

《第一行代码》Android学习笔记（5）广播机制Broadcast

【Hadoop 01】简介

install npm 单独安装依赖包_npm install 安装依赖疑惑点

npm 命令 npm install name 简写(npm i name)依赖装到依赖包node_modules里，后面加-s/-d 都是在这步基础上再添加到package.json中。 npm install name -save 简写(npm i

java面试字符串算法

一、概要本文介绍了有关字符串的算法第一部分的Java代码实现，算法目录：替换字符串中的空格输入一个字符串，打印出该字符串的所有排列第一个只出现一次的字符翻转句子计算字符串之间

frp内网穿透部署教程--mack版

frp内网穿透部署教程–mack版 1. frp简介 FRP 项目地址 https://github.com/fatedier/frp/blob/master/README_zh.md

Django学习总结前言

这段时间出于对python的好奇，自学了会爬虫和python相关的框架技术，顿时就像发现了阿里巴巴的宝藏的大门一样，充满了惊讶，原来web原来还可以这样写的！与以往边看书边写总结不一样，这次我打算一次性把书相关内容看完，再写相关的总结和归纳，总结和归纳的内容主要分为两

Rust处理JSON

基本操作 Cargo.toml: