Bikal Basnet's picture

Bikal Basnet

bikalnetomi

·

AI & ML interests

None yet

Organizations

models 18

bikalnetomi/RLHF-PPO-PPOModel-LLama3-1B-v1.4

Text Generation • 1B • Updated Dec 2, 2024 • 5 •

bikalnetomi/RLHF-PPO-PPOModel-LLama3-1B-v1.3

Text Generation • 1B • Updated Dec 2, 2024 • 5 •

bikalnetomi/RLHF-PPO-PPOModel-LLama3-1B-v1.1

Text Generation • 1B • Updated Dec 2, 2024 • 6 •

bikalnetomi/RLHF-PPO-PPOModel-LLama3-1B-v1.0

Text Generation • 1B • Updated Dec 2, 2024 • 5 •

bikalnetomi/RLHF-PPO-RewardModel-LLama3-1B-v1

Text Classification • 1B • Updated Dec 2, 2024

bikalnetomi/RLHF-PPO-RewardModel-LLama3-1B-v2

Updated Dec 2, 2024

bikalnetomi/rlhf-ppo-llama3-1B-Reward-model-lora-bikal

Updated Dec 2, 2024

bikalnetomi/RLHF-PPO-RewardModel-LLama3-3B-v2

Text Classification • 3B • Updated Dec 2, 2024

bikalnetomi/RLHF-PPO-RewardModel-LLama3-1B-v1.1

Text Classification • 1B • Updated Dec 1, 2024 • 2

bikalnetomi/RLHF-PPO-RewardModel-LLama3-3B-v1

Text Generation • Updated Dec 1, 2024 • 1

datasets 0

None public yet