Udio の使い方確認

AIでの楽曲生成サービスの Udio が先日アップデート&サブスク開始したので、
ガイドのページ を見て使い方再確認をしてみる。

Inpainting の使い方を間違えていたといおう前例もあるし
機能を正しく理解できてなかった箇所があるかもしれないし、
今まで気付いていなかった機能や使い方が見つかるかもしれない。
あと現状 Suno と比較すると自分的に刺さる曲が生成されにくい気がしていて、
それがプロンプト指定の仕方とかで改善できないか期待してる。

基本(Basics)

  • プロンプトは自由形式(free-form text)とタグ(tags)で記述する
    • 自由形式は「~についての曲(a song about xxxx)」など。
    • タグは音楽ジャンルや使う楽器など。タグとして認識されるよう正しく指定しないと生成曲が違うジャンルになったりするかも?(Auto-completions や Suggested tags で候補になるものを与えるとよさげ)
  • 区切り記号は「,(カンマ)」以外に「;(セミコロン)」「.(ピリオド)」も使える。
  • 記載順で優先順位が変わるとかはないらしい
    • 同じ指定を複数記述して強調することができるらしい

自動補完/おすすめタグ(Auto-completions/Suggested tags)

  • 入力途中でタグとして使用できる候補が表示される
  • 入力済みの内容から関連度の高いタグ候補が表示される

歌詞とインストゥルメンタル(Custom lyrics and instrumentals)

  • 歌詞は手動入力/自動生成、もしくは歌詞のないインストゥルメンタルから選択
    • 歌詞は漢字を正しく読めない率まあまあ高いので、開始記述の際はカタカナ表記するとか工夫が必要
  • 歌詞は[Verse][Chorus]などのセクション指定をしてやることができる
  • 「()」で囲んだ部分の歌詞はバックコーラス的に解釈される
  • 歌詞としてサポートされる言語は、英語のほかに中国語、日本語、ロシア語、ポーランド語、ドイツ語、フランス語、イタリア語

マニュアルモード(Manual mode)

  • デフォルトだとプロンプトの後処理によって補完がされよきにはからってくれるらしいが、マニュアルモード有効化することで詳細・厳密な指定をすることもできる
    • マニュアルモードだと自由形式は無視されてタグのみ使って生成されるらしい。プロンプトが歌詞に作用しにくいので歌詞は手動指定がおすすめとのこと

トラック拡張(Extending tracks)

  • 原時点の Udio は生成結果が32秒で固定。曲の前後に拡張を行うことで32秒以上の曲を生成することができる
    • 曲の前にイントロ(曲の始まり)orセクション追加、曲の後にアウトロ(曲の終わり)orセクション追加ができる
  • プロンプトの内容を(一部)修正することで曲の雰囲気を変化させるような使い方もできる

リミックス(Remixing tracks)

  • 生成結果から類似度を指定して再生成をさせることができる(現状はExtendしていない曲だけで可能らしい)
  • 歌詞やプロンプトを変更することもできるが、類似度を控えめにしておく必要がある

曲の修正(Inpainting)

  • 生成結果の一部(歌詞の発音がおかしいとか)修正するための機能(サブスクユーザーのみ使用可能な機能)
  • 上下に2つの波形が表示されるが下の波形で作業領域(working region)を選択して、上の波形で修正したい領域を選択する
    (Add regionで最大4つまで修正箇所増やせる)
  • 歌詞のテキストについて、作業領域にあたる部分を「***」で囲う必要がある。
    手入力で「***」を入力する以外にも、歌詞の該当部分選択してタブキー押して「***」を挿入する機能もある
    (作業領域と「***」で囲った部分が一致していないと修正結果がおかしなことになる)

Tag: Udio