【自己紹介】+食パンより限りなく薄ーいうすーい研究の話。
2024-04-04
azblob://2024/04/04/eyecatch/2024-04-04-research-tweet-embedded-000_0.jpg

はじめましての人ははじめまして、お久しぶりって人はいないと思うかな?(誰だよ)

今年度よりFIXERで働かせて頂くことになりました、海野 翼(うんの つばさ)です。                
多分海野って苗字は珍しい方だと思うし、「うんの」って読み方もあんま無いよねぇー(基本「うみの」か「かいの」でしょー)


自己紹介

名前: 海野 翼(うんの つばさ)                
出身: 山形県西村山郡朝日町 (リンゴとワインが有名なトコ)                
年齢: 21 (イチロウデス、ハイ。)                
趣味: コーヒー、ウマ娘、ゲーム

ゲームですが特に音ゲー大好きで、ACだとウニ、オンゲキとかやってます…                
コンシューマだと最近はSwitch版グルコス(やってる人います?いたら教えて…)                
あとレースゲーとかが好きで最近(?)だとGT7、NFSシリーズとか。

ウマ娘大好き。スぺちゃんもふもふしたい。ちなみに競馬もその影響で興味持ってたり…(福島よく行ってました)     
馬券は買ったことあるんですが、基本はずれたり収支マイナスだったり…

あとコーヒーこれは欠かせないよね!!!!                
毎日4杯近く飲んでます(カフェイン中毒一向聴)                
ちなみに初給料はネスカフェのバリスタでも買おうかと…(デバイス購入支援の対象になりませんかね~!?)                
豆から挽くのは一時期やってたけどめんどくなった、だって無難なコーヒー1番美味いし…                
コンビニのコーヒーって無難で美味しいなーって。


うすーい研究の話

さてと、自己紹介はこの辺に、そろそろ学生時代にやってた研究でも。                
「TwitterからJRの運行情報を取得する」ってことやってました。

背景としては、仙台高専広瀬エリア放送(JOXZ2CM-AREA)を運営していた研究室に居たもので…

放送コンテンツでJRの運行情報を発信しようってなったんですよね。

それで運行情報をTwitterから取得しようってなって…(公式サイトやどこトレは二次利用禁止なので)

…こんな簡単なことって思われるかもしれないけど、かなり苦戦したんですよね。

…まず、2023年4月1日、Twitter APIの有料化。                
結論からいうと、

無料でツイート取得するの難しくなりました。

…元々はねTweepy使って取得する予定だったんだけどね。

そこでGoogle Custom Search JSON APIとTwitter Publish oEmbed API使って取得することに。

まぁ無料で使えるAPIには頼るワケですが…Twitter API使用がTwitterの一部規約にありますしお寿司。

まず、コンテンツを二次利用する際はどうしますか?

基本的な方法に"スクレイピング"と呼ばれる方法があります。                
いわゆるF12キーで開発者モード開いてhtml覗いたことありますよね?よね?                
そこからプログラムで要素取ってくるって感じで…、PythonであればBeatifulSoup4使ったりね。

しかしTwitter(現X)君は厳しくてね、スクレイピング使えないんですよ。                
利用規約を見てもらうと分かるんですがスクレイピング禁止って。

あとはrobots.txtとか読んでもらえれば分かると思います。とりあえずTwitterのrobots.txtのリンク置いておきますね。

https://twitter.com/robots.txt

そこで、私が取った手法として…            
1. Google Custom Search JSON APIへ検索キーワードを送信            
2. 検索結果からTwitterのURLを取得            
3. 取得したURLをTwitter Publish oEmbed APIへ渡す            
4. Twitter Publish oEmbed APIでツイート埋め込み            
 

って流れで研究進めてたワケですよ、ハイ。

ちょっとここで手法で出てきた要素について少し解説をば。            
まず、Google Custom Search JSON APIについて。            
簡単にまとめると、「Googleの検索結果をJSONで取得できる」APIです。

次に、Twitter Publish oEmbed APIについて、            
これは、「Twitterのツイートを埋め込む」APIです。            
例えば、こんな感じにツイートが表示されてるサイトってありますよね。

㊗️【2024年 入社式】🌸           

昨日、東京本社にて24年新卒のみなさんの #入社式 を行いました🎉           

FIXERは、今年は79名の新入社員を迎えました👏           
世界一を生成する仲間として、これから一緒に頑張っていきましょう💪           

改めて、ご入社おめでとうございます🌸🎉           
よろしくお願いします🙌 pic.twitter.com/0LuyzSozIA

— 【公式】FIXER採用 (@FIXER_Recruit) April 2, 2024

まぁこんな感じになるように。(これで伝わるのかな?)                
これをPythonでプログラミングしていました。

あ、ついでに宣伝します。(媚びを売る)

FIXER採用(@FIXER_Recruit)フォローしてあげてね~~!!!!!!

うん、これぐらいにしておきましょう。(怒られろ)

          
ちなみに、Twitterは規約にツイートの権利がTwitter社に譲渡される形となるのでTwitter API使って元のままツイート表示すれば二次利用OKだよー、と。

だからブログなどでTwitterのツイートをこうやって引用したり出来るわけですね!!(°∀°)    

これを仙台高専広瀬エリア放送(JOXZ2CM-AREA)での放送コンテンツに応用しちゃおうってワケです。

…こんなに色々語ったワケですが、

私は、手法を示すことしか出来ませんでしたので…実装は後輩に託すことにします。

時間もっと欲しかった… (ボソッ)


さいごに

そんな感じで、後味の悪い研究になってしまったのですが…               
まぁ、後輩が上手くやってくれるでしょう(笑)

           

FIXERではこんな感じで終わりたくないですね…               
がんばるぞー、えい、えい、むん。

P.S. 実はブログ書くの楽しみで前日から仕込みしてたなんて言えない…