引き続き↓この記事のことについて、つまり生成AIとの共同開発について、ぶちぶちと・・・取り留めなく・・・。
↓ これを作っています。

課金問題にぶちあたっています。こういうとき、皆さんどうしてるんだろう?
スマホ版フォト診断
実装は済んで、現在テスト中です。
そして、ここにきて悩ましい問題にぶちあたりました。

仕様か課金か
フォト診断について言うと、複数問題があっても、そのうち1つにしぼって修正案を出す、という今の仕様は、不完全だと思っています。
複数問題すべてをクリアして初めて、視覚障害者のUI体験の解決になると思うからです。
現在、機械診断+フォト診断+画像alt診断すべてを実行すると、1ページあたり約10円かかります。ほとんどAI代です。サーバ代は誤差の範囲。
診断を完璧に「意味のある」ものにしようとすると、さらに課金が嵩みます。診断時間も伸びていきます。
ジレンマです。
そこで・・・
無料ティアに移行を検討
商用サービスではないので、診断時間を犠牲にしてもよければ、無料キーを使うことも検討しています。
現在は有料の Vertex AI を使っていますが、AI Studioの無料ティアを使えば、診断料はほとんどサーバ代の0.2円程度(それも毎月の無料枠に収まる可能性あり)のみになります。
無料ティアへの移行での欠点は
・診断が学習に使用される恐れがある
・毎分のAIコール数が15回までと制限される(有料キーは数千回のオーダー)
・そのため、診断時間が3〜4倍かかるようになる。
AIを使ったアプリは、無料範囲だと、速度や1度に使える回数を制限していたり、というのもあり、ああそういうことだったのか、と今になって思ったり・・・
改変はちょっと面倒
自分がプログラミングするわけではないし、設計もほとんどAIがやってくれるので、楽なハズなんだけど、ちょっと気が重い。
きっと、仕様を追加する、とか前向きなことは楽しいんだろうなぁ。
お財布を守らないと、っていうようなちょっと消極的な理由だと気が乗らないんだと思う。
でもやらないとね。
と、きょうはそんなところで。
作ってます。
---
追記:無料キーの短所
思い出しました。無料ティアの短所がもう一つ。
API コールのエラーが頻発すること
429エラーは、先に書いたとおり RPM(リクエスト数)やTPM(トークン数) を守ることで「減らす」ことはできます。
でも、500(Internal Server Error)とか503(Service Unavailable)というエラーがあって、これはGoogleのサーバ側の問題なので、こちら側で発生を未然に防ぐことはできません。
主に、サーバの障害や一時的な混雑が原因です。これらが出た場合は、少し時間を置いてから再試行(リトライ)する、という方法が一般的なので、実行時間が長くなり、結局エラーということもあります。
企業向けにSLA(稼働率保証)が設定されている Vertex AI に対して、AI Studio の特に無料ティアは優先順位が低く設定されています。結果として、AI Studioの無料ティアは、商用利用レベルの堅牢さは期待できないと考えたほうが良いみたい。
混雑については、特に米国が動き出す22時以降が顕著なので、日本時間で昼間使うならそんなに障害にはならないかもですが、こんなふうに障害対応中だと弱いかも。

結論:もう少し悩む
と、ちょっと弱気になったところで・・・