10日记
发布时间:
3月以来,感觉在学习道路上有了点提升,再不写写日记,我怕以后啥都不知道了。要点:1.从自然语言那本书和视频大概了解了一些信息,比如说
3月以来,感觉在学习道路上有了点提升,再不写写日记,我怕以后啥都不知道了。要点:
1.从自然语言那本书和视频大概了解了一些信息,比如说,分词,词性标注,关键词提取,词向量训教。其实这四个将会是未来用的相当多的方面
2.从tensorflow构建典型的cnn,lstm,bilstm网络,但是参数和优化,以及损失这些有待提高
上面学到的东西,反过头来,问题出现了:
1.HMM,crf这两种模型,目前是根本不知道咋回事儿的,以至于在词性标注方面,空白。
2.语料的训练,形成词库。语料又训教成词向量(带有纬度的训练,以及参数的设置),词向量的保存,加载。
3.tensorflow构建模型,输入整数最好。因此还要加现有的数据集,训练为62774*n维的矩阵
4.多注意力的加入,在设置好bilstm模型了,该在哪里写上这一代码,还要多看论文。
5.下一步,选择适合的方面去应用。下周总结,希望能解决绝大多数现存问题。