TA貢獻7條經驗 獲得超0個贊
這種情況本地就只能想辦法把你的中間結果序列化了存儲到本地磁盤,然后接著計算,最后相當于用I/O來代替你的內存。
分布式的大數據平臺也是一樣的原理,如果數據量太大,你可以考慮自己弄個單節點的Spark來做,即使內存不足了它也會自動幫你去解決中間結果序列化的問題。
TA貢獻12條經驗 獲得超1個贊
智能時代:寫給想學習大數據的你
¥ 58.00
舉報
Copyright ? 2025 imooc.com All Rights Reserved | 京ICP備12003892號-11 京公網安備11010802030151號
購課補貼聯系客服咨詢優惠詳情
慕課網APP您的移動學習伙伴
掃描二維碼關注慕課網微信公眾號