kaeru39 PRO
ryota39
AI & ML interests
LLM × RL
Recent Activity
liked a model 1 day ago
zai-org/GLM-4.5-Air liked a model 3 days ago
Qwen/Qwen3.5-122B-A10B liked a model 12 days ago
Qwen/Qwen3-1.7B-BaseOrganizations
Local AI Hackathon#001
メタデータラボ様からの計算資源のご提供により構築したモデルおよびデータセットhttps://prtimes.jp/main/html/rd/p/000000008.000056944.html
English_to_Japanese Translator
LLMを用いた英日翻訳モデル
Corpus for DPO in Japanese
直接嗜好最適化のための日本語データセット
Classifier-Boosted Corpus
選好データ分類器によってスコア付けされたコーパス
math Corpus for Japanese
math RL for LLM
算術推論能力を検証するためのモデル
Local AI Hackathon#001
メタデータラボ様からの計算資源のご提供により構築したモデルおよびデータセットhttps://prtimes.jp/main/html/rd/p/000000008.000056944.html
ChatVector
モデル間の重みの加減算のみで構築した日本語LLM
English_to_Japanese Translator
LLMを用いた英日翻訳モデル
Reward Model for Japanese
日本語データセットで報酬モデルを作る取り組み
Corpus for DPO in Japanese
直接嗜好最適化のための日本語データセット
Corpus for RLHF in Japanese
報酬モデルの学習のための日本語データセット
Classifier-Boosted Corpus
選好データ分類器によってスコア付けされたコーパス