問題:在 twitter 上拉取多個用戶時間線以保存為 DataFrame。這是一個完美的解決方案,一次為一個用戶提供:import tweepyimport pandas as pdimport numpy as npACCESS_TOKEN = ""ACCESS_TOKEN_SECRET = ""CONSUMER_KEY = ""CONSUMER_SECRET = ""# OAuth process, using the keys and tokensauth = tweepy.OAuthHandler(CONSUMER_KEY, CONSUMER_SECRET)auth.set_access_token(ACCESS_TOKEN, ACCESS_TOKEN_SECRET)# Creation of the actual interface, using authenticationapi = tweepy.API(auth, wait_on_rate_limit=True)# Running only on handle returns a dataframe tweets = api.user_timeline(screen_name='pycon', count=10)print("Number of tweets extracted: {}.\n".format(len(tweets)))data = pd.DataFrame(data=[tweet.text for tweet in tweets], columns= ['Tweets'])data['len'] = np.array([len(tweet.text) for tweet in tweets])data['ID'] = np.array([tweet.id for tweet in tweets])data['Date'] = np.array([tweet.created_at for tweet in tweets])data['Source'] = np.array([tweet.source for tweet in tweets])data['Likes'] = np.array([tweet.favorite_count for tweet in tweets])data['RTs'] = np.array([tweet.retweet_count for tweet in tweets])print(data)上面的效果很好,將pycon在 DataFrame 中返回用戶最近的 10 條推文。下一步是添加多個要查詢的句柄。這是使用多個句柄執行相同操作的代碼:#Added list of handleshandles = ['pycon', 'gvanrossum']#Added Empty DF to filltest = []運行這將給出兩個輸出。data將是一個包含gvanrossum10 條最新推文的 DataFrame (作為句柄列表中的第二個句柄,這是有道理的)。第二個輸出將是test,這是一個列表。有趣的是test包含來自pycon和 的所有 20 條推文gvansossum,但采用列表形式。循環正在運行,但它沒有保存為 DataFrame。問題:如何將多個句柄之間的循環保存為 DataFrame?
添加回答
舉報
0/150
提交
取消