亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

pytorch自然語言處理之Pooling層的句子分類

 概括

        Pooling作为最简单的层可以作为句子分类任务。

429

流程图

第一步搭建网络

700

这里除了划线的和类的名字外,其他都是pytorch固定模板。__init__就是搭建网络的函数,forward是数据怎么在你刚搭建的网络中流动的写出来就行,注意数据矩阵的维数,要前后对上。该维度可以用view(),t(),transport()。

这里的Embeding层就是把现实客观特征转成电脑识别的特征,也就是特征向量化。

第二步读入数据并将数据数字化

数据是这个样子:


526

前面文本后面类别

700

读取文本的类

700

清洗英文文本的函数,这个写过一次后,下次清洗文本直接复制直接用。

文本读取完后,建立词典,为只有数字序列化做准备。函数如下:


563

字典为:


194

然后通过函数调用就能生成数字序列:


610

第三步开始训练


618

因为用SGD很多时候不能够收敛。。。特别悲催


700


684

这是计算精确度的函数,在一遍跑好的模型上走一遍Dev数据,得出开发集准确率。torch和numpy交换就用  .numpy()。

最后得出结果:

这个贼耗时间


292


434


430

精确度慢慢增长。。。



作者:zenRRan
链接:https://www.jianshu.com/p/06fa1e8c4115


點擊查看更多內容
TA 點贊

若覺得本文不錯,就分享一下吧!

評論

作者其他優質文章

正在加載中
  • 推薦
  • 評論
  • 收藏
  • 共同學習,寫下你的評論
感謝您的支持,我會繼續努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進行掃碼打賞哦
今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與 放棄機會
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

舉報

0/150
提交
取消