Publications

Preprints

Jaeyong Ko, Pilsung Kang, Yukyung Lee (2026). Cliff Tokens: Identifying Single-Token Failure Triggers in LLM Mathematical Reasoning. preprint.

Xiang Fu*, Seungmin Cho*, Yukyung Lee, Najoung Kim (2026). LLMs Learn Better In-Context from Rules than from Examples. preprint.

Wonjun Choi, Yerim Kim, Yukyung Lee†, Susik Yoon† (2026). PGMem: Tightly Coupled Persona–Memory Graph for Lifelong Personalized Agents. preprint.

Yukyung Lee, Yumeng Shen, Jinhyeong Park, Hyein Yang, Jun-Hyung Park (2026). CIRF: Tokenizing Chain-of-Thoughts into Reusable Functional Units for Efficient Latent Reasoning in Large Language Models. preprint.

Zhengyang Shan*, Yukyung Lee*, Sophie Hao (2026). AI Writers Have a Consistent Stylometric Footprint, but AI Editors Do Not. preprint.

Publications

Yukyung Lee, Yebin Lim*, Woojun Jung*, Wonjun Choi, Susik Yoon (2026). Can Structural Cues Save LLMs? Evaluating Language Models in Massive Document Streams. KDD 2026.

Nicholas Edwards*, Yukyung Lee*, Yujun(Audrey) Mao, Yulu Qin, Sebastian Schuster†, Najoung Kim† (2026). RExBench: Can coding agents autonomously implement AI research extensions?. ACL 2026.

Yukyung Lee, Joonghoon Kim, Jaehee Kim, Hyowon Cho, Jaewook Kang, Pilsung Kang†, Najoung Kim† (2025). CheckEval: A reliable LLM-as-a-Judge framework for evaluating text generation using checklists. EMNLP 2025.

Yukyung Lee, Soonwon Ka, Bokyung Son, Pilsung Kang, Jaewook Kang (2025). Navigating the Path of Writing: Outline-guided Text Generation with Large Language Models. NAACL 2025 (Industry Track).

Jaehee Kim, Yukyung Lee, Pilsung Kang (2024). A Gradient Accumulation Method for Dense Retriever under Memory Constraint. NeurIPS 2024.

Yukyung Lee, Takyoung Kim, Hoonsang Yoon, Pilsung Kang, Junseong Bang, Misuk Kim (2024). DSTEA: Improving Dialogue State Tracking via Entity Adaptive Pre-training. In Knowledge-Based System (IF = 8.8) and KnowledgeNLP@KDD 2023.

Gunho No*, Yukyung Lee*, Hyeongwon Kang, Pilsung Kang (2024). RAPID: Training-free Retrieval-based Log Anomaly Detection with PLM considering Token-level information. Engineering Applications of Artificial Intelligence (IF = 8.0).

Yukyung Lee, Jina Kim, Pilsung Kang (2023). LAnoBERT: System log anomaly detection based on BERT masked language model. Applied Soft Computing (IF = 8.7).

Yukyung Lee, Jaehee Kim, Doyoon Kim, Yookyung Kho, Pilsung Kang (2023). Painsight: An Extendable Opinion Mining Framework for Detecting Pain Points Based on Online Customer Reviews. In WASSA@ACL 2023.

Takyoung Kim, Yukyung Lee, Hoonsang Yoon, Pilsung Kang, Junseong Bang, Misuk Kim (2022). Oh My Mistake!: Toward Realistic Dialogue State Tracking including Turnback Utterances. In SereTOD@EMNLP 2022.

Takyoung Kim, Hoonsang Yoon, Yukyung Lee, Pilsung Kang, Misuk Kim (2022). Mismatch between Multi-turn Dialogue and its Evaluation Metric in Dialogue State Tracking. In ACL 2022.

Youngbin Ro, Yukyung Lee, Pilsung Kang (2020). Multi^2OIE: Multilingual Open Information Extraction Based on Multi-Head Attention with BERT. In EMNLP 2020 (Findings).

Yukyung Lee, Munjeong Kang, Nayoung Kim, Chungmok Lee (2019). Drone Surveillance System Considering Dynamic POIs. In JKIIE.