Mac・iPhoneの音声入力機能をWhisperとGPT-4を使って魔改造する方法
OpenAIのWhisper APIをMac・iPhoneのショートカットアプリで呼び出し、純正を超える高精度な音声入力を実現する方法を解説。GPT-4による校正も組み合わせれば固有名詞の誤変換も激減する
Page 19 of 20
OpenAIのWhisper APIをMac・iPhoneのショートカットアプリで呼び出し、純正を超える高精度な音声入力を実現する方法を解説。GPT-4による校正も組み合わせれば固有名詞の誤変換も激減する
DALL-E 3をAPIで直接操作できるGoogle Colabノートブックを公開。ChatGPTを介さずプロンプトを完全制御でき、日本語でも英語と同等の画像生成結果が得られることを実験で確認
ChatGPT・スピーク・ELSAの3アプリで、フリートーク・ロールプレイ・発音矯正を網羅。年間約5万円で24時間練習し放題、TOEIC満点の実体験に基づくAI英会話学習法を解説する。
AI搭載コードエディタCursorはGPT-4やClaude 3 Opusと統合され、コード修正の提案からファイルへの自動反映まで対応する。無料プランでAPIキーを持ち込んで使う方法も解説
Style DecoderとStyle Slidersを使えば、Midjourneyのスタイルコードから元のチューナーURLやプロンプトを復元し、スライダーで微調整まで行える。他人のスタイルを学ぶ最短ルートを紹介する
OpenAIの音声認識モデルWhisper v3をGoogle Colabで無料で使えるノートブックを公開。srt字幕出力にも対応している
MidjourneyのStyle Tunerで一貫したアートスタイルを作成し、--styleコマンドで何度でも再利用する方法を解説。リアル写真・印象派風など高品質スタイルコードも紹介する
OpenAIの音声合成AI(TTS)を数クリックで試せるGoogle Colabノートブックを公開。6種類の声色から選択でき、生成した音声はGoogleドライブに自動保存される
OpenAI APIキーの発行手順・料金チャージ・使用量の上限設定まで、プログラミング未経験者でもわかるようにスクリーンショット付きで丁寧に解説する
2023年11月のFTインタビューでサム・アルトマンがGPT-5開発を認め、AGIへのロードマップと計算資源の課題を語った。発言の要点を時系列で整理している。
BingチャットとBing Image Creatorを使えば、OpenAIの画像生成AI「DALL-E 3」を無料で利用できる。プレゼン資料やSNS投稿に使えるイラスト素材を、プロンプト一つで生成する具体的な手順と週15回の制限についてまとめた。
DALL-E 3とChatGPTでベクターデザイン素材を作成し、SVG変換する手順を解説。プロンプトの具体化と反復修正のコツを押さえれば、ノンデザイナーでもプレゼン用アイコンやロゴを量産できる