いろいろ試験的な

あれこれを置く場所

楽しい or 楽しくない

 

楽しくなかったらやらない

11月末、AIとの対話ログから物語を生成するプロジェクトを始めたけれど、Geminiと作っていてすごく楽しかった。

 

RAGっぽいこととか、蒸留とかVBRの手法とか、次々に編み出した(世間では常識だったということは後から知った)のもひたすら面白かった。

 

その思いついたことをどんどんコードにしてくれるのもスカッとした。

 

11月から12月ぐらいまでは、自分の体験を成仏させるために、ひたすら物語を生成していたわけだけれど、その後「*1ナラティブセラピー」への応用を思いつき、そこへシフトした。

 

ところが方向がセラピーに向かったとたん、品質の不安定さが致命的なことに気づく。

 

Geminiでその壁にぶち当たったとき、ちゃっぴーにセカンドオピニオンを頼んだら、そこから道が外れていった。

 

・物語とは何か

・物語を執筆する手法は

 

それをとことん詰めるために、重たいちゃっぴーと何度もセッションを重ねてやりとりをした結果・・・投げました。

 

全然楽しくない。

 

私は小説家になりたいわけではないのだ。

 

単に物語生成において、ガチャを避けて品質を安定させたいだけだったのだ。

 

あのときは、完全にちゃっぴーに主導権を奪われていたと思う。

 

あのイライラはなんだったんだろう。焦燥感みたいな、焦りみたいなものがあった。私はこんなことのために生きているのではない、って思った。

 

たしか、コードを1行も書けずに1日経過したところで、我慢できなくなり、そこまでをまとめてもらい、Geminiに持ち帰った。

 

Geminiに笑われた。ずいぶんストイックな作業をされたのですね、と。

 

Geminiはちゃっぴーの作業を尊重しつつ、私の性格に合うやり方を探ってくれたように思う。

 

物語生成は、結局、品質安定するところまではできなくて、あくまでも自分用、あるいは文豪の体験記で遊ぶ程度で終わりました。

 

もし興味をお持ちの場合はこちらをご覧ください。

 

石川啄木「ローマ字日記」

https://corriedale99.gitbook.io/corriedale99/rma/shi-dian-1

 

正岡子規「病牀六尺」

https://corriedale99.gitbook.io/corriedale99/bing-chuang-liu-chi-zheng-gang-zi-gui/shi-dian-1

 

その頃は、GoogleAIのクレジットを4.5万円分をどう使おうなんて贅沢なことを言っていたものだから、たしかこの3視点の試行錯誤に6000円分ぐらい使ったと思う。

 

なんかいろいろ書いたけど・・・

 

好きなことをしてお金を稼げるってすごいことなんだなぁって、素晴らしいアプリとか作っている開発者の方を見ていて思うわけです。

 

尻切れトンボですが、きょうはそんなところで。

 

↓  物語VBRの概念図をちゃっぴーに描いてもらったもの

 

*1:1つのできごとを被害者・加害者・環境の3視点でとらえることで心理的回復をはかる

陳腐化する以前の問題だった件&感動したアプリ2つ

 

最近見つけて感動したアプリ2つ

 

アクセシビリティ関連でたまたま見つけた、または再発見したアプリで感動したものが2つあります。

 

読み上げアプリ Voicepaper

 

ひとつめは Voicepaper。

 

今回Epubメーカーを作り始めてから、そういえば・・・と思い、似た思想のアプリやサービスはない?とちゃっぴーに聞いてみました。

 

いくつか類似の、つまりテキストを読み上げるアプリはあったのですが、真面目に使えそうなものは、課金が年間数千円もすることに驚きました。

 

Voice Dreamというのが有名らしく、試そうとしたのですが、とりあえず試すモードがなく、課金を設定しなければならないので見送りました。

 

Voicepaperも課金ありとあったので、同じだろう、と確認しもせずに放置すること1ヶ月。

 

きょう、ふと起動してみたら、何コレ、すごい!と感動、感心。しかも無料でも十分使えます。

 

GUIがすごい洗練されていて、割と直感的で使いやすく、欲しい!と思う機能がすべて盛り込まれたようなアプリでした。逆に、余計な(?)機能は一切見当たりません。

 

夢中になって、このアプリのバックグラウンドを調べていました。

 

ちゃっぴーとClaudeは、情報に辿り着けず。GrokとGeminiだけが開発者の方を探し出してくれて、ブログで開発への想いなどを読むことができました。

 

わかったことは、

自分が欲しいものを作った

ということ。世の中のニーズではなく。

 

そして、10年も前から公開されていたこと。

 

最近は、AIエージェント開発で、思いついた機能を爆速で実装できていること、などもわかった。

 

これを知った昨夜は打ちのめされていました。

 

でも、こんな素晴らしいアプリと比較すること自体が烏滸がましすぎるんです。

 

私はここから、どうするべきか、何を学ぶべきか?

 

それが大事なんだと思います。

 

 

さて、同じレベルで感動したアプリがもうひとつ

画像認識読み上げアプリ スイフトアイ

 

スイフトアイは視覚に障害のある方をサポートするiPhoneアプリです。カメラで撮影または写真アプリなどから共有された画像をAIが解析し、内容をテキストでお伝えします。

こちらは、

  • 無料版:画像解析を行うと3回に1回、待ち時間が発生します。
  • 有料版:無制限に画像解析をご利用いただけます。

ということからして、APIの無料キーと有料キーを使い分けているのかなぁと推察。

 

画像の解析品質も選べます。

 

解析が完了するとAIに入力された画像データはすみやかに削除され、第三者に提供されることはありません。。安心してご利用ください。

 

個人情報保護の観点、私もこだわった点だったので嬉しくなりました。

 

何がすごいって、視覚障害の方に特化したアプリなだけあり、ものすごく画面がシンプル。VoiceOver(iPhoneの機能で、触ったところを読み上げてくれる。本当にタップしたいときはダブルタップ。→アクセシビリティから設定できるんですが、オンオフのショートカットを設定してからやらないとハマりますので注意かな。)

 

起動して撮影ボタンを押すだけで、ものすごく臨場感のある表現豊かな説明が表示されます。ユーザは VoiceOver の読み上げを聴くことになります。

 

これは、パッチワークでできたコースターの写真の説明。

 

この画像は、様々な布をパッチワークのように組み合わせた、可愛らしい作品の一部を写したものです。

 

画像の中央には、ピンク色の布地に描かれたティーカップとソーサーが目を引きます。その上には、青い布地に白い花柄が散りばめられた小さなタグのようなものが添えられています。ティーカップの下には、白と黒の模様が入った別のカップが描かれています。

 

さらに、猫のような動物の絵柄や、日本の縁起物である達磨(だるま)の絵柄も確認できます。背景には、緑色の布地に白い文字が縦書きで書かれており、「everybody」や「for him」といった単語が読み取れます。また、右側には「seven days in」という文字も見えます。

 

全体的に、温かみのある色合いと、手作り感あふれる優しい雰囲気が感じられる作品です。

く、詳しすぎる。目を閉じていても、造形や色彩が目に浮かぶようです。

 

これは、A11yチェッカーで、Geminiに画像診断をさせたときの表現に近いです。

 

ただし、ここまで表現豊かなのは私がフォト診断で使っている(Gemini2.5flash-lite)とは違うモデルなのだろうし、プロンプトにも工夫があるのだろうと思われます。

 

来週、たまたま開発者の方がセミナーに出るので、いろいろ吸収してきたいなぁと思っています。

 

こんな素晴らしいアプリを作った人ってどんな方なんだろう。とっても楽しみです。

 

これからの自分の在り方・・・・

・制作手段の制限はなくなってきた。

・あとは、課金の問題。

・そして、アイデア。

・自分が欲しいものが何かを知るアンテナ。

 

人生に興味なくなったら、欲しいものも、作りたい意欲もなくなるよね・・・

 

と、そんなところで。

 

 

Geminiモデル一覧とかレート制限とか

ここ2ヶ月でいろいろ覚えたことの備忘録です。ちまちま、ローカルで開発する用。

Google AI Studio の Gemini API のレート制限

ここでRPM(1分間あたりのリクエスト数上限)やRPD(1日のリクエスト数上限)を知ることができます。

ココにアクセス

Google AI Studio

ログイン→左下「Get API Key」→レート制限

もっと簡単に見る方法があるかもしれません。

モデルごと、無料・有料で、かなり幅があります。2026年4月時点、個人的穴場は、

Gemini 3.1 Flash Lite

かな、と思います。RPDがかなり緩いです。有料キーでも爆安で使えます。

用途にもよるんでしょうけれど、テキスト・画像をインプットできて、Thinkingモードもあるので、私の用途(A11yチェッカーの画像診断など)には十分でした。


今現在使える Geminiモデル一覧を取るプログラム

モデルは新陳代謝が激しくて、頻繁に新しいモデルが使えるようになったり、古いのは使えなくなったりします。

Google Colab

でも動きます。その際は、APIキー(AI Studioの無料キーもOK)をシークレットに
GEMINI_API_KEY
という名前で登録してONにしておけば使えます。

gemini_models.txt

というファイルができます。

import google.generativeai as genai
from google.colab import userdata

# 1. APIキーの取得(Colabの「シークレット」から)
try:
    API_KEY = userdata.get('GEMINI_API_KEY')
    genai.configure(api_key=API_KEY)
except Exception:
    print("❌ エラー: Colabの『シークレット』で GEMINI_API_KEY を設定してください。")
    raise

# 2. モデル一覧の取得と整形
print("モデル一覧を取得中...")
model_list = []
header = f"{'Model ID':<40} | {'Display Name'}"
separator = "-" * 60

model_list.append(header)
model_list.append(separator)

for m in genai.list_models():
    if 'generateContent' in m.supported_generation_methods:
        line = f"{m.name:<40} | {m.display_name}"
        model_list.append(line)

# 3. 画面に表示
result_text = "\n".join(model_list)
print(result_text)

# 4. ファイルに出力 (gemini_models.txt)
with open("gemini_models.txt", "w", encoding="utf-8") as f:
    f.write(result_text)

print(f"\n✅ ファイル 'gemini_models.txt' を作成しました。")

AI Studio の Build An App機能

興味が向いてなくて知らなかったのですが、遅ればせながら使ってみました。

プロンプトが咄嗟に思いつかなかったので、

「視覚障害者の方向けに、画像がありありと思い浮かぶような説明を読み上げるアプリを作って」

とだけ言ったら、公開するまで数ステップでWebアプリができてしまいました。

これがAIエージェント開発ってやつなのかぁ・・・とやっと実感が湧きました。

いまって、スマホアプリでさえ、エージェント開発できるなんて、昨日まで知りませんでした。すごい時代なんですね。

いったいぜんたい私にも作れんだろうか?

と、そんなところで。

次は、感動したスマホアプリ2つについて書きたいな、と思います。