@cyberlangke/tokkit-abeja
v1.11.0
Published
ABEJA official model aliases for tokkit.
Readme
@cyberlangke/tokkit-abeja
ABEJA 官方文本模型的 tokkit 子包。
当前纳入的官方主线模型:
abeja/ABEJA-Qwen2.5-32b-Japanese-v1.0abeja/ABEJA-Qwen2.5-7b-Japanese-v0.1abeja/ABEJA-QwQ32b-Reasoning-Japanese-v1.0abeja/ABEJA-Qwen3-14B-Agentic-256k-v0.1
当前不纳入:
abeja/ABEJA-Qwen2.5-32b-Japanese-v0.1- 已被
v1.0取代,不再作为当前主线收口对象
- 已被
abeja/gpt-neox-japanese-2.7babeja/gpt2-large-japanese- 旧研究线,不作为当前官方主线 LLM
abeja/Mixtral-8x7B-*alpha/merged实验线,不作为当前稳定主线
说明:
- 以上纳入模型的
tokenizer.json已验 hash。 abeja/ABEJA-Qwen2.5-32b-Japanese-v1.0abeja/ABEJA-Qwen2.5-7b-Japanese-v0.1abeja/ABEJA-QwQ32b-Reasoning-Japanese-v1.0- 当前都与已支持的
qwen2.5family 完全一致。
- 当前都与已支持的
abeja/ABEJA-Qwen3-14B-Agentic-256k-v0.1- 当前与已支持的
qwen3family 完全一致。
- 当前与已支持的
- 该子包不重复分发 tokenizer 快照,而是复用现有 family,并注册 ABEJA 官方模型别名。
使用方法
npm install @cyberlangke/tokkit-abejaimport { getEncoding } from "@cyberlangke/tokkit-abeja"
const tokenizer = await getEncoding("abeja/ABEJA-Qwen2.5-32b-Japanese-v1.0")
console.log(tokenizer.encode("こんにちは、ABEJA!"))