학력
2023.8
경희대학교 국어학 전공 박사 (Ph.D.)
학위논문: "인공지능의 일상 대화 추론 능력 향상을 위한 자연어 생성 연구"
1993.8 ~ 1995.8
단국대학교 국어국문학과 석사
1988.3 ~ 1992.2
단국대학교 국어국문학과 학사
경력
2024.4 ~ 현재
래블업 주식회사
연구원
2023.9 ~ 2025.3
사이오닉 에이아이
정책 총괄
2017.1 ~ 2017.12
Company AI (네이버 Exit)
사원
수상
- 제5회 학천 박유서 신진국어학상 (박사학위 논문), 2024.
- 한글 및 한국어 정보처리 학술대회 우수논문상, 2022.
저서 및 역서
- 송영숙, 유현조 번역, "기초부터 다지는 통계학 교과서 with 파이썬", 인사이트, 2024.12. (ISBN: 9788966264629)
- 송영숙, 심상진, 고재선, 한수미 번역, "파이썬을 활용한 딥러닝 전이학습", 2023.
- 박조은, 송영숙, "모두의 한국어 텍스트 분석", 길벗, 2023. (ISBN: 9791140704521)
학술 논문
저널
- 강아름, 송영숙, "인공지능 기계 번역과 상호참조해결 말뭉치를 활용한 한국어와 중국어 한정성 비교 연구", 생성문법연구 35(1), 119-141, 2025.
- 宋永淑, 趙元翼, "사람과 AI 모델 간의 화행 주석 개선 방향 연구", 語文硏究 52(1), 69-90, 2024.
- Youngsook Song, Won Ik Cho, "Study on the Domain Adaption of Korean Speech Act using Daily Conversation Dataset and Petition Corpus", Journal of Data Mining & Digital Humanities, NLP4DH, 2024.
- 정유남, 송영숙, 유현조, "한국어 중첩 개체명의 말뭉치 구축 연구", 국어학 105, 309-344, 2023.
- 신현규, 유현조, 송영숙, "AI에 적합한 일반 상식 추론 대화의 자동 생성을 위한 정량적, 정성적 연구", 정보과학회논문지 50(5), 2023.
- 송영숙, 정유남, "국어사전 용례의 윤리성 자동 분류 문제와 제안", 언어와 정보 26(2), 109-127, 2022.
- 송영숙, 유현조, 정유남, "한국어 중첩 개체명 분석을 위한 연구", 한국어 의미학 76, 66-101, 2022.
- 유현조, 송영숙, 김민수, 윤기현, 정유남, "딥러닝 기반 한국어 개체명 인식의 평가와 오류 분석 연구", 언어 46(3), 803-828, 2021.
- 송영숙, 조원익, 박장원, 김성동, "소셜 미디어 뉴스 표제 속 후방 조응 표현의 의미 전달 양상 연구", 한국어 의미학 71, 75-92, 2021.
- 송영숙, 심지수, 오재혁, "담화표지 '아', '어', '음'의 성별과 연령별 사용 양상", 말소리와 음성과학 12(4), 37-45, 2020.
국제 학술대회
- Dasol Choi, Seunghyun Lee, Youngsook Song, "Better Safe Than Sorry? Overreaction Problem of Vision Language Models in Visual Emergency Recognition", WACV 2026.
- Dokyoon Yoon, Youngsook Song, Woomyoung Park, "Stop learning it all to mitigate visual hallucination, Focus on the hallucination target", CVPR, 4200-4208, 2025.
- Dasol Choi, Woomyoung Park, Youngsook Song, "No Language Data Left Behind: A Comparative Study of CJK Language Datasets in the Hugging Face Ecosystem", EMNLP MRL Workshop, 2025.
- Taeeun Kim, Semin Jeong, Youngsook Song, "KoGEC: Korean Grammatical Error Correction with Pre-trained Translation Models", PACLIC 38, 2024.
- Won Ik Cho, Sangwhan Moon, Youngsook Song, "Revisiting Korean Corpus Studies through Technological Advances", PACLIC 2023.
- Youngsook Song, Won Ik Cho, "Study on the Domain Adaption of Korean Speech Act using Daily Conversation Dataset and Petition Corpus", NLP4DH & IWCLUL, 2023.
- Sungjoon Park, Jihyung Moon, Sungdong Kim, Won Ik Cho, Ji Yoon Han, Jangwon Park, Chisung Song, Junseong Kim, Youngsook Song, Taehwan Oh, et al., "KLUE: Korean Language Understanding Evaluation", NeurIPS (Datasets and Benchmarks Track), 2021.
- Won Ik Cho, Sangwhan Moon, Youngsook Song, "Open Korean corpora: A practical report", NLP-OSS, EMNLP Workshop, 85-93, 2020.
국내 학술대회
- 송영숙, 강정석, 김태은, 유현조, 황은진, "원본 의미 보존을 위한 한국어 텍스트 스타일 변환: 합성 데이터 생성과 대규모 평가", HCLT, 2025.
- 송영숙, 강아름, "상호 참조 데이터 세트를 활용한 GPT-4의 다면적 한국어 성능 평가", HCLT 36, 335-339, 2024.
- 강아름, 송영숙, "한정성과 상호참조해결의 만남: 딥러닝 언어모델의 활용", HCLT 36, 576-580, 2024.
- 신현규, 송영숙, "AI에 적합한 일반상식 문장의 자동 생성을 위한 정량적, 정성적 연구", HCLT 34, 153-159, 2022.
- 정유남, 송영숙, 유현조, "한국어 중첩 개체명 말뭉치 구축의 실제", 세계 한국어 한마당 학술대회, 2022.
- 송영숙, 정유남, "국어사전 용례에서의 윤리성 자동 판별 문제", 한국생성문법학회-한국언어정보학회 가을 공동학술대회, 2022.
- 송영숙, 정유남, 유현조, "한국어 중첩 개체명 분석을 위한 연구", 제49차 한국어의미학회 전국학술대회, 2022.
- 김성현, 송영숙, 송치성, 한지윤, "한국어 개체명 인식에서 의미 모호성 연구", HCLT, 203-208, 2021.
- 유현조, 정유남, 송영숙, 김민수, 윤기현, "한국어 개체명 인식의 현황과 전망", 한국언어학회 여름학술대회, 178-192, 2021.
특허
- "이기종 GPU 클러스터 환경에서 메모리 전송 성능기반 동적 모델 배치 및 스왑 방법론"
- "자원 상태 및 요청 특성 분석에 기반한 로컬 및 클라우드 하이브리드 추론 라우팅 방법 및 장치"
- "엑스퍼트 혼합 모델 기반의 도메인 특화 엑스퍼트 라우팅 방법 및 장치"
- 윤도균, 송영숙, 박우명, "멀티 모달 모델의 학습 방법 및 전자 장치"
연구 과제
2025 ~ 2026
2025 독자 AI 파운데이션 모델 프로젝트
과학기술정보통신부 · 참여기업 실무 책임
2026
첨단 GPU 활용 지원 사업
과학기술정보통신부·정보통신산업진흥원·한국정보통신산업협회 · 주관기관 공동연구원
2024.07 ~ 2024.11
대규모 언어모델의 사용자 중심 답변 생성 평가 데이터셋 구축
데이터바우처 사업(AI 가공), 한국데이터산업진흥원 · PM
2024.06 ~ 2025.05
한정성과 상호참조해결: 딥러닝 언어모델의 활용
신진연구지원사업 · 연구원
2022 ~ 2023
AI 언어 능력 평가 체계 운영 및 말뭉치 정비
문화체육관광부·국립국어원 · 연구원
2022.06 ~ 2023.01
말뭉치 함의 분석 연구
문화체육관광부·국립국어원 · 연구원
2022.05 ~ 2022.11
한국어 일반 상식 문장 데이터
NIA(한국지능정보사회진흥원) · 총괄 책임
2020.05 ~ 2020.09
말뭉치 함의 분석 연구
문화체육관광부·국립국어원 · 보조원
강의
- 단국대학교 국어국문학과, "인공지능과 인문학", 2026-1학기.
데이터셋 / 오픈소스
학술 활동
- Langcon 컨퍼런스 개최 (organizer), 2021 ~ 2026 매년 개최
- NLP4DH Program Committee, 2025.
- 빅콘테스트 심사, 2023.
발표 / 초청 강연
2025
- 순천대학교 글로벌지역혁신 전문가 특강, "AI가 읽는 언어, 데이터가 바꾸는 사회", 2025.05.04.
- IT북토크, 번역과 문학 패널 토론, 2025.05.18.
- 단국대학교 신입생 대상 강연, 2025.05.19.
- 단국대학교 진로·창업 특강, 2025.05.27.
- 경희대학교 인문학 진로탐색 강연, 2025.11.03.
- 2026 AI 선도기업 성장전략 세미나, 2025.11.20.
- 2025 Langcon 컨퍼런스, 주최 및 발표, 2025.
2024
- 한림과학원, "한국어 오픈소스 말뭉치 분석", 2024.05.
- 한림대학교 MHC4.0, 비전공자 대상 AI 기반 코딩 교육 세미나, 2024.08.10.
- ETRI 오픈소스 테크 데이 2024, "지속 가능한 성장과 오픈소스 커뮤니티의 역할", 2024.10.15.
- 한국생성문법학회·한국언어정보학회 가을 공동학술대회, "한국어와 중국어의 한정성", 2024.11.09.
2023
- 한양대학교 북콘서트, 한국어 텍스트 분석 공저자 대담, 2023.
- 한국코퍼스언어학회(연세대), "표 기반 유사 문장 말뭉치를 활용한 AI 언어 능력 평가", 2023.
- 한글 및 한국어 정보처리 학술대회(제주), "대화 생성 모델과 인권 말뭉치 구축", 포스터 발표, 2023.
- 한국어문교육연구회(서울대), "일상 대화에서의 화행 분석과 자연어 생성 연구", 2023.
기타
- 기술 블로그 편집 (한/영/일): blog.sionic.ai
- 해커톤 3건 참가, 2024.