読者です 読者をやめる 読者になる 読者になる

PythonからのTwitterAPI利用

参考にしたサイト

 

・基本的な使い方

・データフォーマットあり

TwitterAPI でツイートを大量に取得。サーバー側エラーも考慮(pythonで) | コード7区

 

必要ライブラリ

OAuth認証

・MysqlDB

 

日付のフォーマット変換(TwitterAPIからdatetime型に変換してmysqldbでinsert)

http://qiita.com/kenmatsu4/items/23768cbe32fe381d54a2

 

 

re.compile()

文字列の前にrを付けるのが普通。そうすると、文字列中のバックスラッシュ文字をそのままバックスラッシュとして扱えるので、パターンの書き方が煩雑にならない。

import re
pattern = re.compile(r'3.*?7') # 3で始まり7で終わる最短の文字列

 

TwitterAPI仕様。過去Tweetは3200件までしか取れないらしい(頑張れば可能)

dx.24-7.co.jp

 

日付は厄介なので必ずJSTに統一して比較する

import datetime
from pytz import timezone
from dateutil import parser

tweetCreatedAt = parser.parse(tweet['created_at']).astimezone(timezone('Asia/Tokyo'))

 

フォローユーザーの取得

osa030.hatenablog.com

 

 

Posgre設定

C:\Program Files\PostgreSQL\9.6\dataのpg_hba.confに以下を追記(他ホストからの接続を許可。posgresql.conf内の設定(listen_address、port)は修正不要だった)

host all all 192.168.0.0/24 md5

http://rina.jpn.ph/~rance/linux/postgresql/connect.html

 

Python Windowsの統合環境 Anaconda PyCharm

http://pythondatascience.plavox.info/python%E3%81%AE%E3%82%A4%E3%83%B3%E3%82%B9%E3%83%88%E3%83%BC%E3%83%AB/python%E3%81%AE%E3%82%A4%E3%83%B3%E3%82%B9%E3%83%88%E3%83%BC%E3%83%AB-windows/