Papers by GovTech 📝 - a govtech Collection

govtech 's Collections

Benchmarks by GovTech 🏋️‍♀️

Guardrails by GovTech🛡️

Papers by GovTech 📝

LionGuard 2 🦁 ✌️

RabakBench 🙊

Know Or Not 🤔

MinorBench 🍎

SEA-Lionv2.1 SECURE 👮

Off Topic Guardrail 🛡️

Papers by GovTech 📝

updated Jul 29, 2025

LionGuard: Building a Contextualized Moderation Classifier to Tackle Localized Unsafe Content

Paper • 2407.10995 • Published Jun 24, 2024 • 2
A Flexible Large Language Models Guardrail Development Methodology Applied to Off-Topic Prompt Detection

Paper • 2411.12946 • Published Nov 20, 2024 • 22
Safe at the Margins: A General Approach to Safety Alignment in Low-Resource English Languages -- A Singlish Case Study

Paper • 2502.12485 • Published Feb 18, 2025 • 2
MinorBench: A hand-built benchmark for content-based risks for children

Paper • 2503.10242 • Published Mar 13, 2025 • 5
Know Or Not: a library for evaluating out-of-knowledge base robustness

Paper • 2505.13545 • Published May 19, 2025
RabakBench: Scaling Human Annotations to Construct Localized Multilingual Safety Benchmarks for Low-Resource Languages

Paper • 2507.05980 • Published Jul 8, 2025 • 2
Measuring What Matters: A Framework for Evaluating Safety Risks in Real-World LLM Applications

Paper • 2507.09820 • Published Jul 13, 2025
Toxicity-Aware Few-Shot Prompting for Low-Resource Singlish Translation

Paper • 2507.11966 • Published Jul 16, 2025
LionGuard 2: Building Lightweight, Data-Efficient & Localised Multilingual Content Moderators

Paper • 2507.15339 • Published Jul 21, 2025 • 1
Running in CIRCLE? A Simple Benchmark for LLM Code Interpreter Security

Paper • 2507.19399 • Published Jul 25, 2025 • 2
Reasoning Beyond the Obvious: Evaluating Divergent and Convergent Thinking in LLMs for Financial Scenarios

Paper • 2507.18368 • Published Jul 24, 2025 • 1