language

package
v0.55.3 Latest Latest
Warning

This package is not in the latest version of its module.

Go to latest
Published: Dec 1, 2023 License: MIT Imports: 11 Imported by: 0

Documentation

Index

Constants

This section is empty.

Variables

View Source
var (
	ChDict = sat.DefaultDict()
)

Functions

func ChangeFileCoding2GBK

func ChangeFileCoding2GBK(inBytes []byte) ([]byte, error)

func ChangeFileCoding2UTF8

func ChangeFileCoding2UTF8(inBytes []byte) ([]byte, error)

ChangeFileCoding2UTF8 自动检测文件的编码,然后转换到 UTF-8,但是导出 bytes 的时候会把头部的 BOM 信息去除

func ChineseString2Lang

func ChineseString2Lang(chineseStr string) language.MyLanguage

ChineseString2Lang 将 中文描述:简、繁、简英 转换为 types.MyLanguage 支持的字符串语言见 internal/types/language/my_language.go

func ConvertToString

func ConvertToString(log *logrus.Logger, src string, srcCode string, tagCode string) string

ConvertToString 将字符串从原始编码转换到目标编码,需要配合字符串检测编码库使用 chardet.NewTextDetector()

func DetectSubLangAndStatistics

func DetectSubLangAndStatistics(oneDialogue subparser.OneDialogue, langDict map[int]int,
	usefulDialogueEx *[]subparser.OneDialogueEx, chLines *[]string, otherLines *[]string) int

DetectSubLangAndStatistics 检测语言然后统计

func GetLangOptions

func GetLangOptions() whatlanggo.Options

GetLangOptions 语言识别的 Options Whitelist

func HasChineseLang

func HasChineseLang(lan language.MyLanguage) bool

HasChineseLang 是否包含中文

func ISOString2SupportLang

func ISOString2SupportLang(isoString string) language2.MyLanguage

ISOString2SupportLang 从语言缩写字符串转换为内部的 MyLanguage 类型 1. 支持 ISO 639-1、639-2/B、639-2/T、639-3 2. 支持中文的多种变种编码 https://en.wikipedia.org/wiki/List_of_ISO_639-1_codes

func ISOSupportRegexRule

func ISOSupportRegexRule() string

ISOSupportRegexRule 获取 ISO 匹配的 regex 表达式

func IsBilingualSubtitle

func IsBilingualSubtitle(lan language.MyLanguage) bool

IsBilingualSubtitle 是否是双语字幕

func IsSupportISOChineseString

func IsSupportISOChineseString(isoString string) bool

IsSupportISOChineseString 是否是受支持的语言,中 1. 支持 ISO 639-1、639-2/B、639-2/T、639-3 2. 支持中文的多种变种编码

func IsSupportISOString

func IsSupportISOString(isoString string) bool

IsSupportISOString 是否是受支持的语言,中、英、日、韩 1. 支持 ISO 639-1、639-2/B、639-2/T、639-3 2. 支持中文的多种变种编码

func IsWhiteListLang

func IsWhiteListLang(lang whatlanggo.Lang) bool

IsWhiteListLang 是否是白名单语言

func Lang2ChineseString

func Lang2ChineseString(lan language.MyLanguage) string

Lang2ChineseString 将 types.MyLanguage 转换为中文描述:简、繁、简英 支持的字符串语言见 internal/types/language/my_language.go

func LangConverter4Sub_Supplier

func LangConverter4Sub_Supplier(subLang string) language.MyLanguage

LangConverter4Sub_Supplier 语言转换器,给字幕的提供者实例解析使用(xunlei、zimuku等) 支持的字符串语言见 internal/types/language/my_language.go

func MyLang2ChineseISO

func MyLang2ChineseISO(myLanguage language2.MyLanguage) string

MyLang2ChineseISO 中文语言编码变种,见 ISOLanguage.go 文件,这里区分简体、繁体等,如果语言是非中文则这里是空

func MyLang2ISO_639_1_String

func MyLang2ISO_639_1_String(myLanguage language2.MyLanguage) string

MyLang2ISO_639_1_String 内置的语言转换到 ISO_639-1_codes 标准

func SubLangStatistics2SubLangType

func SubLangStatistics2SubLangType(countLineFeed, AllLines float32, langDict map[int]int, chLines []string) language.MyLanguage

SubLangStatistics2SubLangType 由分析的信息转换为具体是什么字幕的语言类型

func WhichChineseType

func WhichChineseType(inputString string) int

WhichChineseType 是简体中文(1)还是繁体中文(2),如果都不是,那么是 0

Types

This section is empty.

Jump to

Keyboard shortcuts

? : This menu
/ : Search site
f or F : Jump to
y or Y : Canonical URL