今回は前回の記事の続きです。
前回は研究室の事務作業を自動化することで一日4時間の作業を10秒に短縮したというお話をしました。
今回もプログラム未経験の私が、Pythonを学び始めて僅か2週間で作り上げたツールを1つ紹介したいと思います。
プログラミングを勉強し始めて1週間ほどで、インプットには飽きてしまいますよね。
私も同様の時期がありました。
プログラミング初心者の方でも作れるツールをいくつか紹介することで、自分も何かツールを作ってみよう!と思っていただけると幸いです!
筆者の経験談
事務作業自動化ツールを作って浮かれていたある日のこと…
リンリンくん、君にはそろそろ隔週で論文紹介をしてもらうよ。
え?どんな論文を読めばいいんですか?
面白そうな論文を5報くらい読んで、一番良いものを詳しく読んでみんなに発表してもらうよ。
全部英語ですよね!せめて3報くらいにしてくださいよ!
面白そうな論文を5報くらい読んで、一番良いものを詳しく読んでみんなに発表してもらうよ。(2回目)
・・・
英語論文ってほんとめんどくさいんですよね。
単語は難しいし、Google翻訳に頼み込んでも文量が多すぎて15回くらいに分割しないといけないし。
なんとかならないかな~~~~~~~~~~
Pythonならなんとかなるんじゃね!?!?
ほんならなんか便利なライブラリないかな~~~~~~~~
※ライブラリ:天才たちが作ったプログラムを拡張してくれる便利アイテム
ありました。Google翻訳を簡単にするライブラリが。
では作っていこう!!!
論文自動翻訳ツールの流れは次のような感じですね
- PDF形式英語論文を指定して、文書を読み込む
- ピリオドで区切って一文一文をPythonに吸収させる
- 参考文献はいらないから消す
- 10文ずつくらいを翻訳させる
- Wordに翻訳した文を書き込ませる
では簡単に各ステップを説明していきます。
ステップ1から早速行き詰りました。PDFファイルって読み込めるのか・・・?
ほんならなんか便利なライブラリないかな~~~~~~~~
ありました。PDFファイルを読み込んでくれるライブラリが。
ほんとPythonすきです。天才たちが作ってくれてるから。
これで難なくステップ1クリアですね
ステップ2では長ったらしい英文章をピリオドで区切って1文章ごとに分割していきます。
そうしないと文が長すぎてGoogleが翻訳してくれません。
英語論文では図に必ず Fig. 1 のように無駄なピリオドが入っており、これが不具合を生みます。
そこで「Fig. のピリオドだけは無視してな!」とPythonに命令することで不具合を防ぎます。
ステップ3は結局、自動で参考文献を削除することができませんでした。
プログラム開始時に「この人名が出てきたらプログラムを止めろ!」とPythonに命令することで参考文献を読み込まないようにしました。
ステップ4はジェントルマンシップが求められた項でした。
Google翻訳ライブラリといっても魔法ではありません。ネットにアクセスして、1回1回Googleに翻訳してもらっているだけです。
200文もある英語論文を高速で200回もアクセスしたら怒られます。
そこで20文ほどをまとめてアクセスすることで負担を軽くし、1回アクセスしたら5秒待つという命令を組み込みました。だから怒らないでGoogle様。
ステップ5でまたもや行き詰りました。Wordに書き込みってできるのか?と
ほんならなんか便利なライブラリないかな~~~~~~~~
ありました。Wordに書き込みしてくれるライブラリが。
ここまで便利だと若干引きますね。若干。
こうして英語論文を無事に全て日本語にすることができました!
1つの論文につき大体5分くらいで日本語にしてくれましたね。
このプログラムを見た同期は
頼むリンリン!俺にも使わせてくれ!
と頼み込んできました(笑)
まとめ
この経験談を見ると、なんだか難しそうなことをやっているなと思うかもしれません。
しかしまっっっったくそんなことはないのです!だってPython始めて2週間の私が作れているのだから。
Pythonの基本を習得して、ライブラリに頼み込めば案外なんとかなるものです。
この記事をみたあなたも、ネット・データ・情報に関わることならなんでも自動化できるのです!
自分好みのツールを作成して、プログラミングの楽しさを一緒に味わいましょう!
コメント