亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

機器人機器學習模型的正確方法

機器人機器學習模型的正確方法

繁花不似錦 2022-07-05 17:40:09
我正在尋找使用哪種模型或方法的起點。案例如下:一個有 9 個輸入的機器人:-6個提供距離的傳感器-檢測崩潰的傳感器-左電機當前轉速- 右電機的當前速度輸出:2 個數字(或 2 個布爾值)控制 2 個電機(左前和右前)現在我正在考慮讓機器人想辦法不崩潰。我將 6 個傳感器連同一個“有效/無效”作為數據輸入模型然后訓練模型以找出當傳感器值低于某個數字時電機需要比另一個更快避免崩潰輸入。另外,我需要告訴模型需要避免崩潰標志?,F在作為平臺,我正在考慮一個樹莓派,可能有一個天藍色的連接,所以我可以使用我想要的任何模型但我在尋找哪種型號?它需要從連續數據中學習。嘗試一些東西,寫回去,從中學習,然后嘗試其他東西。輸出可能需要多回歸或多二進制。輸入也是如此,多個輸入。需要已經從新的數據點中學習。任何想法?
查看完整描述

1 回答

?
拉莫斯之舞

TA貢獻1820條經驗 獲得超10個贊

您正在尋找強化學習。有很多關于機器人或游戲 AI 的文獻。它是如何工作的,就像你說的那樣,持續不斷。

它(代理)有一個環境(傳感器,當前速度),他可以執行將導致環境反應的動作(控制電機)。通過給定的操作,它將獲得獎勵,例如distance from object < before=> +1 否則 -1。你明白了。通過嘗試,失敗,它會創建自己的策略(它的行為)來最大化獎勵。

加固中最常用的算法是Q-Learning(其深度學習方面稱為 DQN)。

這是一篇可能與您的問題有關的論文:鏈接


查看完整回答
反對 回復 2022-07-05
  • 1 回答
  • 0 關注
  • 146 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號