Our Mission
home
About us
home

07. 한국어 언어 모델 (KoGPT, KoBART 등) 응용 기술 개발

분야
AI
세부 설명
■ 연구 내용 - 한국어 언어모델 응용기술 개발 - 모델 기반 데이터 증강 실험 ■ 연구 목적 - 한국어 ChatGPT 향 multi-task 언어모델 기술개발 ■ 활용 계획 - 데이터 증강실험을 통한 성능 개선 - 언어모델을 응용한 어플리케이션 개발 ■ 관련 경험/역량 - 자연어처리, 언어모델 - huggingface, pytorch, distributed training
과제 번호
07

01 멘토 소개

김민상

Machine Learning Research Engineer
NLP, Language Modeling

02 프로젝트 소개

GPT-3 스케일의 언어모델을 이용하여 한국어 ChatGPT 로 가기위한 텍스트 생성 기반 Instruction data augmentation, 빅 모델의 제로샷 성능 향상을 위한 instruction fine tuning, Human Feedback data augmentation 증강 등의 프로젝트를 진행 하려고 합니다.
또한, 언어모델을 활용하여 아이디어를 자유롭게 내시어서 다양한 어플리케이션을 만들어 볼 수 있는 기회를 제공해드립니다. (e.g. 빅모델을 이용한 챗봇모델, 프롬프트 기반 텍스트 데이터 생성 앱 등)
많은 현업 멘토분들과 함께하여 SKT 에 함께 기여해 주실 수 있으시며, 학교에서 경험하기 힘든 스케일의 빅모델을 다뤄보실 수 있습니다.

03 이런 Fellows를 찾습니다

GPT-3 스케일의 빅모델을 활용하여 여러 응용 어플리케이션을 만들고 싶으신분
한국어 기반 NLP 모델링에 관심이 많으신분
프롬프트 기반 텍스트 생성에 관심이 많으신 분
최신 기술 습득을 즐기시며 열정이 넘치시는 분
현재 아는 것 보다는 앞으로 알고 싶은 것이 더 많은 지적호기심이 많으신 분

FAQ

Q) 어플리케이션 개발과 데이터 증강 실험을 통해 성능 개선이 동시에 이뤄져야하는 과제일까요? 아니면 언어 모델을 활용한 어플리케이션 개발만 되어도 될까요?
A) 연구 활동 기간 동안에는 최종 선발된 팀과의 조율 하에 두 개 중 하나를 진행할 가능성이 큽니다. 어플리케이션 개발이나, 모델 또는 휴리스틱 기반 데이터 증강 및 클린징을 통한 언어모델의 근본적 성능개선이 될 수 있습니다.
Q) 어플리케이션 개발 수준이 어디까지 인지가 궁금합니다. 시장에 프로덕트를 내는 수준까지 인지, 아니면 주요 기능 개발 정도까지일까요?
A) 시장에 프로덕트를 내는 수준은 아니고, 주요 기능 개발 정도로 생각하고 있습니다.
Q) 프로젝트 진행에 있어 파이썬으로도 충분할까요? 프로덕트를 개발해야 하는 수준이라면, 어떤 언어와 기술 스택을 사용해야 할까요?
A) 파이썬으로 충분하며, 부족한 부분은 오셔서 멘토링을 통해 배우시면서 진행하시면 됩니다.