李宏毅-机器学习2021春-5


1 Word Embedding

  • 将每一个Word都投影到一个High Dimension的空间上。
  • 相似的词距离近。
  • 不同的Dimension代表不同的含义。

image-20211024203125452

  • Word Embedding是一个unsupervised的过程。机器通过阅读大量文章,根据上下文信息进行学习。

    • Counting based

      image-20211024204856348

    • Prediction based:拿出Prediction Model的第一个hiden layer,即可得到word embedding.

      image-20211024211849142

2 Recurrent Neural Network

​ 有记忆的NN。

image-20211024220030007

Long Shor-term Memory(LSTM)