Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

请求:专为日语优化的翻译专家 #16

Open
BiFangKNT opened this issue Aug 31, 2024 · 6 comments
Open

请求:专为日语优化的翻译专家 #16

BiFangKNT opened this issue Aug 31, 2024 · 6 comments

Comments

@BiFangKNT
Copy link

BiFangKNT commented Aug 31, 2024

日语作为小众语种,且语法复杂(相较英语),默认的翻译常常无法正确地传递信息,因此希望增加一个专为日语优化的翻译专家。

@Mishasama
Copy link

这个大概还要区分方言和口语略语、敬语、文言文等吧?

@BiFangKNT
Copy link
Author

这个大概还要区分方言和口语略语、敬语、文言文等吧?

口语敬语是常规操作了。至于方言和古语可以不适配,适配标准日语就足够了。

@BiFangKNT
Copy link
Author

这个大概还要区分方言和口语略语、敬语、文言文等吧?

主要问题是口语,还有网络用语之类的新词。

@Mishasama
Copy link

新词

离线的开源模型估计做不到3年内的新知识。口语通常都会夹杂一些方言或者略语,不知道目前有哪个模型对这方面掌握得比较好。
针对日语这种“海纳百川”的语言,如果用通用的咒文估计效果不会太自然,难以做到以假乱真的程度。可能需要特定领域或者场景才能更自然的表达。

@BiFangKNT
Copy link
Author

新词

离线的开源模型估计做不到3年内的新知识。口语通常都会夹杂一些方言或者略语,不知道目前有哪个模型对这方面掌握得比较好。 针对日语这种“海纳百川”的语言,如果用通用的咒文估计效果不会太自然,难以做到以假乱真的程度。可能需要特定领域或者场景才能更自然的表达。

为什么要限定开源模型呢?我就用glm4plus啊。3年太夸张了,就算是老一点的gpt4,知识库也是更新到2023年的。口语会夹杂方言是因果倒置,并不是口语中出现方言,而是方言中的口语化表达,因此这属于方言,并不强求能够准确翻译。

@Mishasama
Copy link

为什么要限定开源模型呢?

付费模型的话……研究/开发咒文的成本也许比较高呢。
你有没有什么特定的用途,或者你所说无法正确传递信息的案例呢?

话说不同的模型也会影响翻译结果与期待值的偏差,对咒文的理解也不完全一样。你确定你的glm4+能满足你的需求吗?(主要看训练集)
比如说需要输出中二病风格,那全塞中二病样本+正常语言差异对照的小模型肯定比普通的大模型的味道更正宗,也更容易编写合适的咒文。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants