レシピサイトからのデータダウンロードについて
レシピサイトのレシピデータをダウンロードする機能
レシピの登録が少し手間
わかっているんです。
いちいち手で材料と分量を手入力して、作り方まで手入力するのは面倒だなって。パッとやってピッとデータが入ったら多少は便利になって、試しに使ってみてやろうかな、という人もちょっとは現れてくれるのでは。
イメージできることは実現できる。
昔、スノボ初心者の職場の先輩がそう言い残してキッカー(ジャンプ台)から消えていったことがあります。
パッとやってピッでは実現不可能ですが、どんなことができたらいいか具体化してみます。イメージできることは実現できる。
- レシピ本の写真をパッ撮ったら文字をピッと読み取る。
- レシピサイトをパッと入れたらレシピをピッと読み取る。
- パッとやってピッとしなくても十分なくらい初めから十分データが入っている。
1つ目は画像から文字を読み取る(OCR)機能をどこかから拝借して、文字に起こしたデータから「材料」とか「分量」とか「作り方」を抽出するカラクリが作れたらできそうですが、ハードルがちょっと高い感じがします。
2つ目はレシピサイトのhtmlファイルからデータをうまく抽出できれば実現可能で、こちらは1つ目よりハードルは低そうです。
3つ目はどこから大量のレシピを拝借してくるか?もあるし、レシピ自体の美味しさに関してまで責任を負わなければいけないので、レシピを一つ一つ試作して試食する手間が発生しそうです。
とりあえず現実的なのは2つ目なので、この線で検討を進めました。
できるけれどやらない
実装はできた
有名レシピサイトを2つくらい観察したところ、どちらもhtmlのソースコード内にレシピデータのjsonデータが記載されているところがありました。ここだけ切り取ってYourRecipeのレシピデータに変換するというのはあまり難しくはなく、実際に実装はできました。
レシピの著作権
実装してから、これってダメなんじゃないか?という気がしてきました。
今やっていることはあくまで趣味です。私には本業が別にあります。ろくな収入にもならないのにここで無意味に危ない橋を渡ってトラブルになることを避けない理由がない。そこでまずはレシピの著作権について調べてみました。
調べた法解釈をここに書くのはとても責任を持てないので差し障りのない結論だけ書くと、レシピのコピーは絶対にダメだとまでは確認できませんでしたが、確実に問題ないとも言い切れない、要するにグレーでした。
そもそも、YourRecipeの場合はコピーをすると言っても、公に公開するわけではなくそれぞれの個人利用の範疇なので、そもそも著作権侵害に当たらない、と言う可能性もあります。
でも、そんなことではないんです。危ない橋を渡る意味がなさすぎるんです。とにかく面倒事は避けないといけません。真正面からぶつかりましょう。勇気を出して某有名レシピサイトに直接聞いてみました。許諾をもらえたら言うことなしです。
ダメでした。
「レシピのダウンロードは利用規約違反です」とのことでした。利用規約にはっきりとそうは書いていなかったんですけど、ダメだと言われたらダメです。他所様にご迷惑をおかけしてはいけません。単に怪しいやつだと思われて門前払いを食らっただけのような気もしましたが、怪しいやつだと思われたままなのは癪なので、せめてきちんとご確認いただいたことにお礼を申し述べてさっと引き下がりました。
やっぱりなんとかしたい
こういうことを認めてくれているレシピサイトを使えば良い
そもそもhtmlのソースを覗いてパクるような微妙なことをするからいけないのであって、(これはこれでスクレイピングと言って一応認められていることみたいですが)きちんとデータ抽出のためのapiを提供してくれているレシピサイトであれば、何ら問題ないのでは?
ということで、他に使えそうなところがないか現在調査中です。
まとめ
想像力が大切
<- next : なぜClojureなのか
-> prev : 自作の静的サイトジェネレータ、名前はまだ無い。