Tag: twitter

如何获得tweepy输出到Excel?

我是一个编程新手,但我希望你能帮我解决我的问题。 我试图用tweepy / python / stream.api和R(统计程序)来分析tweets。 知道stream侦听器正在工作,但我不能使用输出… 这是我正在运行的脚本: import tweepy consumer_key="…" consumer_secret="…" access_key = "…" access_secret = "…" auth = tweepy.OAuthHandler(consumer_key, consumer_secret) auth.set_access_token(access_key, access_secret) api = tweepy.API(auth) class CustomStreamListener(tweepy.StreamListener): def on_status(self, status): print status.text def on_error(self, status_code): print >> sys.stderr, 'Encountered error with status code:', status_code return True # Don't kill the stream def on_timeout(self): […]

JSON到CSV:如何在最终的Excel表中添加filter(列)?

首先,如果我的描述对你来说不够准确,我表示歉意,我是一个新手,我不知道有关编程的事情,所以不要犹豫告诉我,如果你需要更详细的信息,但我会尝试尽可能精确。 所以我已经下载了一堆鸣叫感谢Twitter的API和terminal(通过Twurl)。 所有的推文都在一个.json文件中(我用TextWrangler打开,我在Mac上),而且当我将.json文件导出到一个.csv文件,以便更容易地处理和分析数据时感谢Excel(或者至less是LibreOffice的Excel版本),我没有所需要的所有参数,我缺less.json文件中每个Tweet信息的“bio”部分。 换句话说,在我的决赛桌上,我有一个推特ID的列,一个是推特作者,一个是推特本身的文字,等等。但是我没有列的生物微博作者,而这个信息显示在.json文件本身。 所以我的问题是:是否有一个代码或任何东西,使我有一个更多的列显示一些更多的信息存在于我最后的.csv表中的基本.json文件? 再次,这可能不明确,所以不要犹豫,告诉我,如果你需要我突出一个具体点。 感谢任何见解,我真的需要帮助,这是一个研究项目,我需要继续为我的博士,所以任何帮助将不只是欢迎! 编辑:作为一个例子,这里是我的原始.json文件中的一条推文的数据示例: { "created_at": "Mon Apr 28 09:00:40 +0000 2014", "id": 460705144846712800, "id_str": "460705144846712832", "text": "Work can suck a dick today", "source": "<a href=\"http://twitter.com/download/iphone\" rel=\"nofollow\">Twitter for iPhone</a>", "truncated": false, "in_reply_to_status_id": null, "in_reply_to_status_id_str": null, "in_reply_to_user_id": null, "in_reply_to_user_id_str": null, "in_reply_to_screen_name": null, "user": { "id": 253350311, "id_str": "253350311", "name": "JEEEZUS", "screen_name": "Maxi_Flex", […]

如何使用EXCEL公式从一列单元格中提取具有特定模式的文本?

请帮助,我有一个数据集,其中包含一列文字,其中包含用户提及和他们的鸣叫。 我想提取EXCEL中推文中提到的所有用户。 换句话说,我想要做这个任务:如果行的单元格值包含文本以@开始并以空格结束,则将该string值放在另一列中,对于列中的每一行,每个单元格可能包含更多而不是一个string(在推文中提到多个用户)。问题是EXCEL公式可能与编码没有关系吗? 如果是的话,请你指导我使用哪个公式。如果不是,你知道完成这个任务的好方法吗? 请不要给我链接文件,如果你有一个良好的文件代码来完成这项任务,或知道一个软件/工具,可以做到这一点将是伟大的。 感谢您的帮助提前。

从Excel中查找/提取Emojis

使用Twitter Archiver(TAGS),我收集了这样的推文: RT @LeyLaLaa:芬兰| 8种方式,像芬兰人在图尔库群岛夏天🇫🇮☀️桑拿,湖泊,重复😍… @OurFinland #ttot 我已经在Excel中导出电子表格。 现在我想find哪个表情符号是最常用的。 对于这个推文,我应该有☀️和😍。 我也尝试提取和计数#hashtags,链​​接,图片/video等。 任何想法的公式?

根据索引号对Excel中的Twitter数据进行sorting

问题: 我正在研究我的论文,而且我必须说我对于Excel中更高级的东西来说是相当新颖的,而且我从来没有使用过R。 我做了以下事情:我使用R连接Twitter,并根据某个关键字search并保存了Tweets。 现在我想确保我的数据正确sorting,所以我可以对它进行分析。 然而,我似乎无法得到我的数据固定的权利,也没有与R(因为它不读取数据),也没有与Excel。 目前我的数据如下所示: 数据示例: ,"text","favorited","favoriteCount","replyToSN","created","truncated","replyToSID","id","replyToUID","statusSource","screenName","retweetCount","isRetweet","retweeted","longitude","latitude" 1,"RT @cdavandaag: De hashtag #ikstemCDA is deze maand al 7.500 (!) keer gebruikt, fantastisch. Op naar een mooi uitslag. #CDA #PS15 http://t.…",FALSE,0,NA,2015-03-17 23:58:23,FALSE,NA,"577982342775615488",NA,"<a href=""http://twitter.com/download/iphone"" rel=""nofollow"">Twitter for iPhone</a>","Cecile2511",25,TRUE,FALSE,NA,NA 2,"RT @Matthijs85: Ligt het trouwens aan mij of wordt verschil CDA/VVD nu heel groot uitgelicht, terwijl ze feitelijk 92% hetzelfde […]

阅读用python提取的推文

我正在尝试阅读excel中的推文。 Tweets已经被python (和tweepy )检索,然后保存在一个csv文件中: # -*- coding: utf-8 -*- writer= csv.writer(open(r"C:\path\twitter_"+date+".csv", "w"), lineterminator='\n', delimiter =';') writer.writerow(["username", "nb_followers", "tweet_text"]) auth = tweepy.OAuthHandler(consumer_key, consumer_secret) auth.set_access_token(access_token_key, access_token_secret) api = tweepy.API(auth, wait_on_rate_limit=True, wait_on_rate_limit_notify=True) for tweet in tweepy.Cursor(api.search, q="dengue+OR+%23dengue", lang="en", since=date, until=end_date).items(): username=tweet.user.screen_name nb_followers=tweet.user.followers_count tweet_text=tweet.text.encode('utf-8') writer.writerow([username, nb_followers, tweet_text]) 由于utf-8编码,我有问题在文本编辑器或Excel中阅读。 比如这个推文: 在Excel中给出这个: b"\xe2\x80\x9c@ThislsWow: I want to do this \xf0\x9f\x98\x8d http://t.co/rGfv9e70Tj\xe2\x80\x9d pu\xc3\xb1eta […]

将列A中的所有@mentions和#hashtags复制到Excel中的列B和C.

我有一个非常大的tweets数据库。 大多数推文都有多个#hashtags和@mentions。 我希望所有的#hashtags用一列中的空格和另一列中的所有@mentions分隔。 我已经知道如何提取@mention和@mention的第一次出现。 但是我不知道把它们全部弄清楚吗? 一些推特有多达8#的标签。 手动浏览推文并复制/粘贴#hashtags和@参数似乎是超过5000条推文的不可或缺的任务。 这是我想要的一个例子。 我有列A,我想要一个macros将填充列B和C.(我在Windows&Excel 2010) Column A ———– Dear #DavidStern, @spurs put a quality team on the floor and should have beat the @heat. Leave #Pop alone. #Spurs a classy organization. Live broadcast from @Nacho_xtreme: "Papelucho Radio"http://mixlr.com nachoxtreme-radio … #mixlr #pop #dance "Since You Left" by @EmilNow now playing on […]

如何在Excel中将时间分组到不同的时期?

我有一个电子表格,里面有几千条推文,每个都有这样的时间戳:18/05/2014 21:14 在我已经整理出来的其他function中,我想把所有的推文都绘制在一个由15分钟片段组成的图表上。 我怎样才能将这些不同的时间(微博)分组在一起?