RabbitMQの勉強をしている訳だけども中断する
そもそもクローラを作るのがメインタスクでRabbitMQの勉強は復習って感じな訳だけれども、あまりにもサボり過ぎた為にクローラから離れすぎてるし、勉強はここら辺で切り上げてクローラ作りに戻ろうと思う。勉強は落ち着いたら再開って事で。
そんな感じでRabbitMQ&Python&Pikaで非同期動作のベースを作って、そこにクローラを載せていきたいと思うが、その前にやる事がある。スクリプトの書き直しだ。
スパイダとクローラに分けて今まで作ってきたけども、これを書き直す。クラス化してしまう。
今考えてるのは以下の4つに分けてしまう方法
- spider スパイダ
- crawler クローラ
- scraper スクレイパー(クローラで使う)
- db DB周り(スパイダ・クローラで使う)
上記の4つのクラスを非同期動作ベースになるスクリプトへ組み込んで使う感じにしたいと思う。