1 |
키노트 |
박상원 |
DeepNatural AI |
고품질 코퍼스를 만들어 드립니다. |
- |
2 |
키노트 |
이기창 |
NAVER Chatbot Model |
한국어 임베딩 : 컴퓨터는 자연어 의미를 어디까지 이해할 수 있을까 |
임베딩(embedding)은 자연어를 숫자의 나열인 벡터로 바꾼 결과 혹은 그 일련의 과정 전체를 가리키는 용어입니다. 단어나 문장 각각을 벡터로 변환해 벡터 공간에 ‘끼워 넣는다(embed)’는 취지에서 임베딩이라는 이름이 붙었습니다. 컴퓨터가 자연어를 처리할 수 있게 하려면 자연어를 계산 가능한 형식인 임베딩으로 바꿔줘야 합니다. 임베딩은 컴퓨터가 자연어를 이해하도록 하는 첫 관문으로 매우 중요한 기능을 합니다. 자연어 처리 모델의 성능은 임베딩이 좌우한다고 해도 과언이 아닌데요. 다양한 임베딩 기법을 일별하고 그 속에 숨어 있는 언어학적 배경 등을 살펴보고자 합니다. 인과관계(casuality), 추론(reasoning) 등 최신 연구 트렌드에 대해서도 토론해 보았으면 좋겠습니다. |
3 |
키노트 |
김준석 |
현대차 AIR랩 |
자동차 만드는 회사에서 필요한 NLP |
- |
1 |
스피커 |
김현중 |
시간에 따른 뉴스의 토픽 변화 시각화 (중급) |
- |
|
2 |
스피커 |
박희영 |
서울대학교 심리학과 |
기업 리뷰 텍스트 분석을 통한 만족도 예측과 조직분야 사전 구축(초급) |
비전공자인 심리학 전공 대학원생으로서 자연어 처리에서 경험한, 그리고 진행 중인 연구를 소개합니다. 1) 심리학, 조직 및 HR 분야에서 NLP 적용 방안 2) 조직 분야 텍스트의 전처리와 사용자 사전 구축 |
3 |
스피커 |
박정현 |
- |
쿠팡 리뷰 서비스를 개선시키는 실전 리뷰데이터 분석! |
리뷰 데이터는 자연어 처리 중 누구나 접해본 주제입니다. 쿠팡에서 주어지는 리뷰서비스의 문제점을 느끼고, 이를 개선하고자 하는 목적성을 가지고 리뷰 데이터를 분석(초급) |
4 |
스피커 |
조원익 |
서울대학교 전기정보공학부 |
화행, 그 이론과 데이터 구축의 간극 |
화행은 종종 의도와 혼용되지만, 산업보다는 언어학적 측면에서 주로 다루어집니다. 본 발표에서는, 기존 화행 이론의 유형화 방식이 추구하는 바를 화용, 의미 및 통사론의 시각에서 바라보고, 이것이 실제로 산업에서 사용될 수 있는 의도 파악 데이터의 구축에 어떻게 활용될 수 있는지 알아보려 합니다. |
5 |
스피커 |
김태형 |
Trost |
실시간 감정 피드백 챗봇 개발 후기 |
심리상담 메신저 ‘트로스트’ 업체의 머신러닝 엔지니어로 활동하면서 내담자의 감정을 분석해 실시간으로 감정 피드백을 해주는 챗봇 프로젝트를 진행하면서 느낀 생각과 후기(초급) |
6 |
스피커 |
김재윤 |
국회예산정책처, 서울대학교 행정대학원 |
법률 텍스트에 대한 비 학습 접근- 30년간의 형벌 수준 변화 추적 등 사례를 중심으로 |
법률의 규칙성을 이용해서 단순하고 오래된 방법으로 텍스트에서 유용한 정보를 추출한 사례들을 소개합니다. html 문서를 parsing할 때 tag 등 규칙성을 이용하듯이, 법률 또한 잘 코딩된 문서이기 때문에 정형화된 규칙을 이용할 수 있습니다. 우리가 html 문서를 parsing할 때 머신러닝을 잘 사용하지 않듯이, 법률에도 머신러닝 이전 단계에서 할 수 있는 것들이 많습니다.’닭 잡는데 소잡는 칼을 쓰지 마라’는 고사처럼 말이죠. 소개할 사례는 첫째, 지난 30년간 전체 법률에 있는 형벌 규정의 수와 형량의 강도가 어떻게 변했는지를 분석했습니다. 둘째, 법률에 특정 종류의 조문이 얼마나 존재하고, 어떻게 퍼져나갔는지를 분석할 수 있습니다. 간단한 도구로 입법의 역사를 분석하는 것입니다. 셋째, 디버깅을 하듯 법률에 존재하는 인용연결 오류, 즉, 404 error를 발견하는데 정보추출 방법을 사용했습니다(중급) |
7 |
스피커 |
김영준 |
정보기술연구소 AI기술팀 자연어 처리 담당 |
롯데의 딥러닝 모델은 어떻게 자기소개서를 읽고 있을까? |
그룹사의 자기소개서 데이터를 기반으로 진행했던 연구들을 진솔하게 담았습니다. 먼저 자기소개서만으로 서류 전형 합격/불합격을 딥러닝이 구분할 수 있는지에 대해 연구했던 과정을 소개합니다. 더불어 “AI가 자기소개서를 적어줄 수 있을까?” 라는 아이디어를 가지고 Transformer 딥러닝 모델로 자기소개서 문장이 생성되는 Prototype모델을 시연합니다. 끝으로 [Ctrl+C, Ctrl+V] 자기소개서를 딥러닝 모델로 어떻게 찾는지와 오타 데이터를 검정하는 방법을 소개합니다.(중급) |
8 |
스피커 |
박세진 |
월포초등학교 |
초등학교 서술형 평가 자동채점시스템 개발 및 활용 |
학급 수준의 반복되는 평가 활동에서 생성되는 서술형 평가 문항 자료를 활용하여 기초 수준의 자동채점시스템을 개발한 후, 이를 다시 학급 현장에 활용하는 방안을 모색해보았습니다.(비전공+입문) |
1 |
튜토리얼1 |
김지은 |
- |
다큐멘터리 크롤링과 TF-IDF |
(초급) |
2 |
튜토리얼2 |
신승우 |
NCSOFT Language AI Lab |
트리 정규표현식의 소개와 이를 이용한 반자동 트리 라벨링 |
(파이썬 중급자, 언어학 초급) |
3 |
튜토리얼3 |
송영숙, 박세진 |
- |
자연어처리 이론과 파이썬 기초 |
가장 간단한 파이썬 튜토리얼을 지향합니다. 본격적으로 자연어를 분석하기 전까지의 과정들을 다룹니다.(입문) |
4 |
튜토리얼4 |
최영락(Developer Product Marketing Manager) |
전미정(케라스 코리아 운영진, 마이크로소프트 AI MVP) |
클라우드 AI 활용 튜토리얼 |
- |
5 |
튜토리얼5 |
현청천 |
헬로엔엠에스 |
Transformer & BERT 구현하기 |
Transformer는 가장 기본이 되는 모델입니다. NLP를 하시는 분이라면 꼭 봐야하고 깊게 이해할 필요가 있다고 생각됩니다. BERT는 Transformer Encoder를 사용한 모델입니다. BERT는 현재 NLP의 표준모델이라고 봐도 무방합니다. BERT는 발표 된지 1년이 지난 현재 까지도 다양한 시도를 통해 개선되고 발전되고 있는 모델입니다. 이 두 모델을 가장 작은 형태로 구현해 보는 과정을 통해 더 깊이 이해하는 것이 목표입니다.(고급) |
6 |
튜토리얼6 |
유원준 |
KOSCOM 분석팀 |
딥 러닝을 이용한 자연어 처리 입문 |
텐서플로우 2.0의 메인 API인 Keras를 사용하여 인공 신경망 자연어 처리 문제들을 풀어봅시다.(초급) |
1 |
포스터 |
최민주 |
국민대학교 자연어처리 연구실 석사과정 |
한국어 대용량 코퍼스의 오류 어휘 탐지 방안 |
대용량 데이터에서 빈도수가 낮은 음절을 이용해 오류 어휘를 탐지하는 방법을 제안하고, 제안 방법을 이용하여 오류 어휘 탐지 시 고려하여야 할 점을 소개합니다. |
2 |
포스터 |
김용범 |
- |
식단추천 서비스를 개발하면서 느낀점들 |
(초급) |
3 |
포스터 |
김도경 |
한림대학교 디지털인문예술전공 |
영화 추천시스템 뽀개기 |
적은 양의 데이터와 간단한 알고리즘으로 사용자가 좋아하는 영화 제목을 입력했을 때 그와 비슷한 영화를 추천, 추천된 영화 제목과 영화에 대한 키워드를 같이 보여주는 영화 추천 시스템을 파이썬을 활용해 구현해 보았습니다! 추천 시스템에 한걸음 더 가까워지는 계기가 되셨으면 좋겠습니다! |
4 |
포스터 |
김도경, 이나라 |
한림대학교 디지털인문예술전공 |
겨울왕국 텍스트를 통한 인물 성격 & 관계 분석 |
겨울 왕국 등장인물들을 어느 정도 알고 계시나요? 파이썬과 gaphi를 활용하여 겨울 왕국 텍스트를 통해 인물 성격 & 관계 분석을 한 뒤 tableau로 시각화를 해보았습니다~ 크리스토프와 안나가 썸을 타고 있는지 아닌지 썸을 타고 있는 거라면 과연 텍스트에도 드러날까요? 영화만 봤을 땐 알지 못했던 새로운 모습들을 발견하실 수 있을 겁니다! |
5 |
포스터 |
신소령, 안유미 |
한림대학교 디지털인문예술전공 |
수사구조개혁 관련 기사 크롤링을 통해 살펴본 언론 보도와 정파성의 관계 |
(초급) |