Documentation ¶
Index ¶
- func WithAccelerationMode(mode AccelerationMode) func(*SynthesizerOption)
- func WithAccentType(at uint64) func(*Word)
- func WithCpuNumThreads(num uint16) func(*SynthesizerOption)
- func WithEnableInterrogativeUpspeak() func(*TtsOptions)
- func WithEnableKana() func(*TtsOptions)
- func WithPriority(p uint32) func(*Word)
- func WithWordType(wt WordType) func(*Word)
- type AccelerationMode
- type AccentPhrase
- type AudioQuery
- type Error
- type Meta
- type Mora
- type ResultCode
- type SpeakerId
- type Style
- type StyleId
- type SupportedDevices
- type Synthesizer
- func (s *Synthesizer) Close()
- func (s *Synthesizer) CreateAccentPhrases(text string, styleID StyleId) (a []AccentPhrase, err error)
- func (s *Synthesizer) CreateAccentPhrasesFromKana(text string, styleID StyleId) (a []AccentPhrase, err error)
- func (s *Synthesizer) CreateAudioQuery(text string, styleID StyleId) (a AudioQuery, err error)
- func (s *Synthesizer) CreateAudioQueryFromKana(text string, styleID StyleId) (a AudioQuery, err error)
- func (s *Synthesizer) GetMetas() (metas []Meta, err error)
- func (s *Synthesizer) IsGpuMode() bool
- func (s *Synthesizer) LoadAllModels() (err error)
- func (s *Synthesizer) LoadModelsFromSpeakerId(speakerId SpeakerId) (err error)
- func (s *Synthesizer) LoadModelsFromStyleId(styleId StyleId) (err error)
- func (s *Synthesizer) Replace(ap []AccentPhrase, styleID StyleId) (a []AccentPhrase, err error)
- func (s *Synthesizer) ReplaceOnlyMoraPitch(ap []AccentPhrase, styleID StyleId) (a []AccentPhrase, err error)
- func (s *Synthesizer) ReplaceOnlyPhonemeLength(ap []AccentPhrase, styleID StyleId) (a []AccentPhrase, err error)
- func (s *Synthesizer) Synthesis(aq AudioQuery, styleId StyleId) (io.ReadCloser, error)
- func (s *Synthesizer) SynthesisWithoutInterrogativeUpspeak(aq AudioQuery, styleId StyleId) (io.ReadCloser, error)
- func (s *Synthesizer) Tts(text string, styleID StyleId, options ...func(*TtsOptions)) (io.ReadCloser, error)
- func (s *Synthesizer) UnloadAllModels() (err error)
- func (s *Synthesizer) UnloadModelsFromSpeakerId(speakerId SpeakerId) (err error)
- func (s *Synthesizer) UnloadModelsFromStyleId(styleId StyleId) (err error)
- type SynthesizerOption
- type TtsOptions
- type UserDict
- func (ud *UserDict) AddWord(word Word) (id string, err error)
- func (ud *UserDict) Close()
- func (ud *UserDict) Import(other *UserDict) (err error)
- func (ud *UserDict) Load(path string) (err error)
- func (ud *UserDict) RemoveWord(id string) (err error)
- func (ud *UserDict) Save(path string) (err error)
- func (ud *UserDict) ToJson() (j string, err error)
- func (ud *UserDict) UpdateWord(id string, word Word) (err error)
- func (ud *UserDict) Use() (err error)
- type Voicevox
- func (v *Voicevox) GetMessageFromResult(code ResultCode) string
- func (v *Voicevox) GetMetas() []Meta
- func (v *Voicevox) GetStyles() []Style
- func (v *Voicevox) GetVersion() string
- func (v *Voicevox) NewSynthesizer(options ...func(*SynthesizerOption)) (s Synthesizer, err error)
- func (v *Voicevox) NewUserDict() (ud *UserDict)
- func (v *Voicevox) SupportedDevices() (sd SupportedDevices, err error)
- type Wav
- type Word
- type WordType
Constants ¶
This section is empty.
Variables ¶
This section is empty.
Functions ¶
func WithAccelerationMode ¶
func WithAccelerationMode(mode AccelerationMode) func(*SynthesizerOption)
ハードウェアアクセラレーションモードを設定する
func WithCpuNumThreads ¶
func WithCpuNumThreads(num uint16) func(*SynthesizerOption)
CPU利用数を設定する 0の場合は環境に合わせてCPUが利用される
func WithEnableInterrogativeUpspeak ¶
func WithEnableInterrogativeUpspeak() func(*TtsOptions)
疑問文の調整を有効にする
Types ¶
type AccelerationMode ¶
type AccelerationMode int32
ハードウェアアクセラレーションモードを設定する設定値
const ( ACCELERATION_MODE_AUTO AccelerationMode = iota // 実行環境に合った適切なハードウェアアクセラレーションモードを選択する ACCELERATION_MODE_CPU // ハードウェアアクセラレーションモードを"CPU"に設定する ACCELERATION_MODE_GPU // ハードウェアアクセラレーションモードを"GPU"に設定する )
type AccentPhrase ¶
type AccentPhrase struct { Moras []Mora `json:"moras"` Accent int `json:"accent"` PauseMora *Mora `json:"pause_mora"` IsInterrogative bool `json:"is_interrogative"` }
アクセント句
type AudioQuery ¶
type AudioQuery struct { AccentPhrases []AccentPhrase `json:"accent_phrases"` SpeedScale float64 `json:"speed_scale"` PitchScale float64 `json:"pitch_scale"` IntonationScale float64 `json:"intonation_scale"` VolumeScale float64 `json:"volume_scale"` PrePhonemeLength float64 `json:"pre_phoneme_length"` PostPhonemeLength float64 `json:"post_phoneme_length"` OutputSamplingRate int `json:"output_sampling_rate"` OutputStereo bool `json:"output_stereo"` Kana string `json:"kana"` }
音声合成用のクエリ
type Error ¶
type Error struct { Code ResultCode Msg string }
type Mora ¶
type Mora struct { Text string `json:"text"` Consonant *string `json:"consonant"` ConsonantLength *float64 `json:"consonant_length"` Vowel string `json:"vowel"` VowelLength float64 `json:"vowel_length"` Pitch float64 `json:"pitch"` }
モーラ(子音+母音)
type ResultCode ¶
type ResultCode int32
処理結果を示す結果コード
const ( VOICEVOX_RESULT_OK ResultCode = 0 // 成功 VOICEVOX_RESULT_NOT_LOADED_OPENJTALK_DICT_ERROR ResultCode = 1 // open_jtalk辞書ファイルが読み込まれていない VOICEVOX_RESULT_GET_SUPPORTED_DEVICES_ERROR ResultCode = 3 // サポートされているデバイス情報取得に失敗した VOICEVOX_RESULT_GPU_SUPPORT_ERROR ResultCode = 4 // GPUモードがサポートされていない VOICEVOX_RESULT_STYLE_NOT_FOUND_ERROR ResultCode = 6 // スタイルIDに対するスタイルが見つからなかった VOICEVOX_RESULT_MODEL_NOT_FOUND_ERROR ResultCode = 7 // 音声モデルIDに対する音声モデルが見つからなかった VOICEVOX_RESULT_INFERENCE_ERROR ResultCode = 8 // 推論に失敗した VOICEVOX_RESULT_EXTRACT_FULL_CONTEXT_LABEL_ERROR ResultCode = 11 // コンテキストラベル出力に失敗した VOICEVOX_RESULT_INVALID_UTF8_INPUT_ERROR ResultCode = 12 // 無効なutf8文字列が入力された VOICEVOX_RESULT_PARSE_KANA_ERROR ResultCode = 13 // AquesTalk風記法のテキストの解析に失敗した VOICEVOX_RESULT_INVALID_AUDIO_QUERY_ERROR ResultCode = 14 // 無効なAudioQuery VOICEVOX_RESULT_INVALID_ACCENT_PHRASE_ERROR ResultCode = 15 // 無効なAccentPhrase VOICEVOX_RESULT_OPEN_ZIP_FILE_ERROR ResultCode = 16 // ZIPファイルを開くことに失敗した VOICEVOX_RESULT_READ_ZIP_ENTRY_ERROR ResultCode = 17 // ZIP内のファイルが読めなかった VOICEVOX_RESULT_MODEL_ALREADY_LOADED_ERROR ResultCode = 18 // すでに読み込まれている音声モデルを読み込もうとした VOICEVOX_RESULT_STYLE_ALREADY_LOADED_ERROR ResultCode = 26 // すでに読み込まれているスタイルを読み込もうとした VOICEVOX_RESULT_INVALID_MODEL_DATA_ERROR ResultCode = 27 // 無効なモデルデータ VOICEVOX_RESULT_LOAD_USER_DICT_ERROR ResultCode = 20 // ユーザー辞書を読み込めなかった VOICEVOX_RESULT_SAVE_USER_DICT_ERROR ResultCode = 21 // ユーザー辞書を書き込めなかった VOICEVOX_RESULT_USER_DICT_WORD_NOT_FOUND_ERROR ResultCode = 22 // ユーザー辞書に単語が見つからなかった VOICEVOX_RESULT_USE_USER_DICT_ERROR ResultCode = 23 // OpenJTalkのユーザー辞書の設定に失敗した VOICEVOX_RESULT_INVALID_USER_DICT_WORD_ERROR ResultCode = 24 // ユーザー辞書の単語のバリデーションに失敗した VOICEVOX_RESULT_INVALID_UUID_ERROR ResultCode = 25 // UUIDの変換に失敗した )
type SupportedDevices ¶
type SupportedDevices struct { Cpu bool `json:"cpu"` Cuda bool `json:"cuda"` Dml bool `json:"dml"` }
利用可能なデバイスの情報。 あくまでVOICEVOX COREライブラリが対応しているかどうかであることに注意すること。
type Synthesizer ¶
type Synthesizer struct {
// contains filtered or unexported fields
}
音声シンセナイザ Voicevox.NewSynthesizerで作成する
func (*Synthesizer) CreateAccentPhrases ¶
func (s *Synthesizer) CreateAccentPhrases(text string, styleID StyleId) (a []AccentPhrase, err error)
アクセント句の配列を生成する
func (*Synthesizer) CreateAccentPhrasesFromKana ¶
func (s *Synthesizer) CreateAccentPhrasesFromKana(text string, styleID StyleId) (a []AccentPhrase, err error)
アクセント句の配列を生成する(AquesTalk風記法)
func (*Synthesizer) CreateAudioQuery ¶
func (s *Synthesizer) CreateAudioQuery(text string, styleID StyleId) (a AudioQuery, err error)
音声合成用のクエリを生成する
func (*Synthesizer) CreateAudioQueryFromKana ¶
func (s *Synthesizer) CreateAudioQueryFromKana(text string, styleID StyleId) (a AudioQuery, err error)
音声合成用のクエリを生成する(AquesTalk風記法)
func (*Synthesizer) GetMetas ¶
func (s *Synthesizer) GetMetas() (metas []Meta, err error)
現在読み込んでいる音声モデルのメタ情報を取得する
func (*Synthesizer) LoadAllModels ¶
func (s *Synthesizer) LoadAllModels() (err error)
すべての音声モデルを読み込む
func (*Synthesizer) LoadModelsFromSpeakerId ¶
func (s *Synthesizer) LoadModelsFromSpeakerId(speakerId SpeakerId) (err error)
話者IDを元にして音声モデルを読み込む
func (*Synthesizer) LoadModelsFromStyleId ¶
func (s *Synthesizer) LoadModelsFromStyleId(styleId StyleId) (err error)
スタイルIDを元にして音声モデルを読み込む
func (*Synthesizer) Replace ¶
func (s *Synthesizer) Replace(ap []AccentPhrase, styleID StyleId) (a []AccentPhrase, err error)
アクセント句の配列を指定されたスタイルで再生成する
func (*Synthesizer) ReplaceOnlyMoraPitch ¶
func (s *Synthesizer) ReplaceOnlyMoraPitch(ap []AccentPhrase, styleID StyleId) (a []AccentPhrase, err error)
アクセント句の配列を指定されたスタイルで再生成する(音高のみ)
func (*Synthesizer) ReplaceOnlyPhonemeLength ¶
func (s *Synthesizer) ReplaceOnlyPhonemeLength(ap []AccentPhrase, styleID StyleId) (a []AccentPhrase, err error)
アクセント句の配列を指定されたスタイルで再生成する(音素長のみ)
func (*Synthesizer) Synthesis ¶
func (s *Synthesizer) Synthesis(aq AudioQuery, styleId StyleId) (io.ReadCloser, error)
AudioQueryから音声合成を行う
func (*Synthesizer) SynthesisWithoutInterrogativeUpspeak ¶
func (s *Synthesizer) SynthesisWithoutInterrogativeUpspeak(aq AudioQuery, styleId StyleId) (io.ReadCloser, error)
AudioQueryから音声合成を行う(疑問文の調整なし)
func (*Synthesizer) Tts ¶
func (s *Synthesizer) Tts(text string, styleID StyleId, options ...func(*TtsOptions)) (io.ReadCloser, error)
音声合成を行う
func (*Synthesizer) UnloadAllModels ¶
func (s *Synthesizer) UnloadAllModels() (err error)
すべての音声モデルをアンロードする
func (*Synthesizer) UnloadModelsFromSpeakerId ¶
func (s *Synthesizer) UnloadModelsFromSpeakerId(speakerId SpeakerId) (err error)
話者IDを元にして音声モデルをアンロードする
func (*Synthesizer) UnloadModelsFromStyleId ¶
func (s *Synthesizer) UnloadModelsFromStyleId(styleId StyleId) (err error)
スタイルIDを元にして音声モデルをアンロードする
type SynthesizerOption ¶
type SynthesizerOption struct {
// contains filtered or unexported fields
}
シンセナイザの作成時に指定するオプション
type TtsOptions ¶
type TtsOptions struct {
// contains filtered or unexported fields
}
Ttsを用いた音声合成時に指定するオプション
type UserDict ¶
type UserDict struct {
// contains filtered or unexported fields
}
ユーザ辞書 voicevox.NewUserDictで作成する
func (*UserDict) UpdateWord ¶
単語を更新する
type Voicevox ¶
type Voicevox struct {
// contains filtered or unexported fields
}
各種関数やポインタなどを保持する構造体
func NewVoicevox ¶
必要なパスを引数に取り、Voicevoxのインスタンスを生成する
func (*Voicevox) GetMessageFromResult ¶
func (v *Voicevox) GetMessageFromResult(code ResultCode) string
結果コードからメッセージを取得する
func (*Voicevox) NewSynthesizer ¶
func (v *Voicevox) NewSynthesizer(options ...func(*SynthesizerOption)) (s Synthesizer, err error)
シンセナイザを作成する
func (*Voicevox) SupportedDevices ¶
func (v *Voicevox) SupportedDevices() (sd SupportedDevices, err error)
利用可能なデバイスの情報を取得する
type Wav ¶
type Wav struct {
// contains filtered or unexported fields
}
出力されたwavファイルを表す構造体 io.ReadCloserを実装している