首頁手記 python2.7進行爬蟲百度POI代碼(劃分小網格算法)

python2.7進行爬蟲百度POI代碼(劃分小網格算法)

標簽：

Python

查询许久，最终选择一个，之前一直py3.6不成功，换了2.7就好多了。如果有重复去下重即可。
这里面非常重要的基类对象的init()方法与超类方法，将在下面进行记录。# -*- coding:utf-8 -*-import jsonimport urllib2import sysimport impimport time#显示当前系统编码print(sys.getdefaultencoding())#修改编码：py3.6无法解析百度地图API,如有人解决imp.reload(sys)
sys.setdefaultencoding('utf-8')#对百度api进行解析class BaiDuPOI(object):

    def __init__(self,itemy,loc):
        self.itemy = itemy
        self.loc = loc#对页数进行循环提取   
 def urls(self):
        api_key = baidu_api
        urls = []        for pages in range(0,20):
            url = 'http://api.map.baidu.com/place/v2/search?query=' 5A&景区 '&bounds=' + self.loc +'&page_size=20&page_num=' + str(pages) + '&output=json&ak=' + api_key
            urls.append(url)        return urls#获取json数据

  def baidu_search(self):
        json_sel = ["name,lat,lng"]        for url in self.urls():
            json_obj = urllib2.urlopen(url)
            data = json.load(json_obj)       
            for item in data['results']:
                jname = item["name"]
                jlat = item["location"]["lat"]
                jlng = item["location"]["lng"]
                js_sel = jname +',' + str(jlat) + ',' + str(jlng)
                json_sel.append(js_sel)        return json_sel#对数据进行关键词提取与写入if __name__ == '__main__':  
    baidu_api = '133d5d0ef4fcc60f7ff63a76f5b538ac'             #这里填入你的百度API
    print "开始爬数据，请稍等..."
    start_time = time.time()
    locs_to_use = ['39.0,116.0,39.05,116.05']    for loc_to_use in locs_to_use:
        par = BaiDuPOI(u'景区',loc_to_use)    #请修改这里的参数
        a = par.baidu_search()
        doc = open('baidu_csv.csv','w')        for ax in a:
            doc.write(ax)
            doc.write('\n')
        doc.close
        end_time = time.time()    print "数据爬取完毕，用时%.2f秒" % (end_time - start_time)





参考文献：http://www.workloadup.com/baidupoi.html

點擊查看更多內容

為 TA 點贊

若覺得本文不錯，就分享一下吧！

評論

評論

共同學習，寫下你的評論

評論加載中...

展開查看更多評論

作者其他優質文章

正在加載中

慕斯卡3302699

算法工程師

手記
篇

粉絲

58

獲贊與收藏

314

關注作者，訂閱最新文章

閱讀免費教程

Python 辦公自動化教程

17個小節 27228 923

Python 算法入門教程

15個小節 29858 1149

Python 進階應用教程

38個小節 71803 1122

推薦

評論

收藏

共同學習，寫下你的評論



感謝您的支持，我會繼續努力的～

掃碼打賞，你說多少就多少

贊賞金額會直接到老師賬戶

支付方式

打開微信掃一掃，即可進行掃碼打賞哦

今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與放棄機會

點擊
抽獎

慕課手記新用戶專享福利

恭喜你，你的運氣太好了，居然抽中了 100個積分！

恭喜你，抽中了價值元的專欄！

太棒了，直接落到你賬戶里！

積分商城里的羅技鼠標、機械鍵盤、
Kindle 閱讀器、小米平衡車
Apple iPad （10.2英寸）、大額優惠券
在等著你去兌換了噢

作者：

免費贈送

兌換碼：1111222211 復制

優惠券可用于購買實戰課、體系課
無門檻使用

先去看看，有什么好東西馬上兌換我愛學習，選課去


亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

python2.7進行爬蟲百度POI代碼(劃分小網格算法)

閱讀免費教程