Agent skill
ai-audio-generation
Stars
5
Forks
0
Install this agent skill to your Project
npx add-skill https://github.com/Gaku52/claude-code-skills/tree/main/ja/07-ai/ai-audio-generation
SKILL.md
AI 音声・音楽生成
AI が音の創造を民主化する。テキスト音声合成、音声クローニング、AI 作曲、サウンドデザインまで、AI 音声・音楽生成の全てを解説する。
このSkillの対象者
- AI 音声・音楽生成技術を学びたいクリエイター
- 音声合成をアプリに組み込みたいエンジニア
- AI 音楽制作に興味がある方
前提知識
- 音声・音楽の基礎概念
- Python の基礎知識
学習ガイド
00-fundamentals — 音声 AI の基礎
| # | ファイル | 内容 |
|---|
01-music — AI 音楽生成
| # | ファイル | 内容 |
|---|
02-voice — AI 音声合成
| # | ファイル | 内容 |
|---|
03-tools — ツールとワークフロー
| # | ファイル | 内容 |
|---|
クイックリファレンス
AI 音声サービス比較:
TTS: ElevenLabs(高品質)/ OpenAI TTS(API統合)/ VOICEVOX(無料・日本語)
音楽: Suno(歌詞→楽曲)/ Udio(高品質)/ Stable Audio
認識: Whisper(オープン)/ Deepgram(API)/ Google STT
分離: Demucs / Spleeter
参考文献
- Radford, A. et al. "Robust Speech Recognition via Large-Scale Weak Supervision." OpenAI, 2023.
- ElevenLabs. "Documentation." elevenlabs.io/docs, 2024.
- Suno. "Documentation." suno.com, 2024.
Recommended Agent Skills
Expand your agent's capabilities with these related and highly-rated skills.
computer-science-fundamentals
A comprehensive guide covering the fundamentals of computer science. From hardware internals and data representation to algorithms, data structures, computation theory, programming paradigms, and software engineering basics — a systematic guide to all the CS foundations every engineer needs.
5
0
Explore
operating-system-guide
5
0
Explore
programming-language-fundamentals
5
0
Explore
algorithm-and-data-structures
5
0
Explore
linux-cli-mastery
5
0
Explore
aws-cloud-guide
5
0
Explore
Didn't find tool you were looking for?