배경 설명
ChatGPT는 100만명 달성 소요 기간이 5일밖에 걸리지 않은 서비스로 굉장히 화제가 되고 있다.
- 빌게이츠, “챗GPT의 등장은 인터넷의 발명만큼 중대한 사건이 될 수 있다.”, “챗GPT 같은 AI가 세상 바꿀 것… 가장 중요한 혁신” (2023.2.)
- 바이든, 이탈리아서 ‘차단’, 바이든 경고까지… 챗GPT 안전성 커진다 (2023.4.)
ChatGPT의 원리
ChatGPT는 Chat Generative Pre-trained Transformer의 줄임말로, 대화형 인공지능 생성형 사전학습 트랜스포머라는 뜻이다.
OpenAI에서 개발한 자연어 처리(NLP; Natural Language Processing) 인공지능 언어 모델을 사용한 대화형 인공지능 서비스이고, 구글 딥마인드의 알파고와 달리, 일반인도 쉽게 사용할 수 있기 때문에 파급력이 더 크다.
- GPT-3를 기반으로 하며 대규모 텍스트 코퍼스(Corpus, 말뭉치)를 사전 학습해서 다음 단어나 문장을 예측하는 방식으로 작동
- 대화 생성 , 번역, 요약 등 다양한 자연어 처리 응용 분야에 활용 가능
- 대규모 데이터셋과 컴퓨팅 파워, 인프라를 필요로 하는 초거대 AI
- 기존의 모델보다 더욱 정교하고 복잡한 작업을 수행
- 대화 생성 분야에서는 인간과 거의 구별을 할 수 없을 정도로 수준이 높음
기존 챗봇과의 차별점은 다음과 같다. 기존 챗봇은 정해진 대답을 하고 모르는 것은 모른다고 대답하지만, ChatGPT는 생성된 대답을 하고 모르는 것도 아는 것처럼 대답한다. 이때, 결과 생성에 사용된 자료 즉, 참고자료를 제공하지 않는다. 또한, 구글 검색 엔진과 달리 한 가지 결과만 출력하기 때문에 원치 않는 내용을 사용자가 선별할 필요가 없다.
ChatGPT의 기술적 특징
- ChatGPT의 버전별 매개변수 수는 다음과 같다.
- GPT-1(1.17억) → GPT-2(15억) → GPT-3(1750억) → GPT-3.5(1750억+RLHF)
- 매개변수(Parameter)는 인간 뇌에서 뉴런과 뉴런을 연결하는 시냅스와 유사한 역할을 한다. 학습된 데이터를 저장하는 공간으로, 파라미터가 많은 AI가 더 정교한 학습을 할 수 있다. 2023년 3월 14일에 출시된 GPT-4는 멀티모달 AI(Multi-modal AI)로 진화하여, 기존 모델과 다르게 이미지 분석이 가능해지고, 처리 가능한 단어 수도 많아지고, 추론 능력도 올라갔다.
- ChatGPT는 딥러닝 기술 중 하나인 트랜스포머(Transformer) 모델을 사용하여 자연어 처리를 수행한다.
- 트랜스포머는 자연어 처리 분야에서 매우 인기 있는 딥러닝 아키텍처 중 하나로, 구글(Google Al Brain Team)에 의해 개발되었으며, 2017년 발표된 논문 <Attention is all you need>에서 처음으로 소개되었다.
- 트랜스포머 모델은 순환 신경망(Recurrent Neural Network, RNN)이나 합성곱 신경망(Convolution Neural Network, CNN) 대신 어텐션 메커니즘을 사용하여 시퀀스 데이터를 처리한다. 특히 자연어 처리 분야에서 이전까지 사용되던 모델에 비해 매우 효과적인 모델로 인정받고 있다.
- GPT는 트랜스포머에서 인코더를 제외하고 디코더만 사용한다.
- ChatGPT는 Pre-trained Language Model(사전 학습 언어 모델)이다.
- ChatGPT는 웹페이지, 책 , 뉴스 등 다양하고 방대한 양의 데이터를 통해, 다양한 문장 패턴과 언어적 특성을 학습했다.
- 기존의 자연어 처리는 개별 작업마다 새로운 모델을 만들어야 했다. 이로 인해 처리 가능한 자연어 종류와 양에도 제한이 있고 새로운 도메인에 대응이 어려운 문제가 있었다. 하지만 ChatGPT는 다양한 자연어 처리 작업에 적용하는 사전 학습 언어 모델을 사용하고, 미리 학습된 모델을 새로운 데이터나 새로운 분야의 특정한 태스크에 맞게 조정하는 미세 조정(Fine-tuning) 단계를 거치면서 새로운 자연어 처리 작업을 위해 새로운 모델을 만들 필요가 없어지게 되었다.
- 인간 피드백을 통한 강화학습(Reinforcement Learning with Human Feedback; RLHF)
- 인간 피드백을 통한 강화학습(RLHF)은 기존 강화학습과 달리, 인간의 피드백을 적극적으로 활용하여 모델을 학습하는 방법이다.
- 기존 강화학습에서는 모델이 환경과 상호작용하면서 스스로 보상을 최대화하는 방법을 찾아나가는데 반해, RLHF는 인간이 제공하는 피드백을 활용한다. 이를 통해, 높은 품질의 자연스러운 문장 생성을 가능하게 한다.
ChatGPT의 활용 사례 및 이슈
영화배우 라이언 레이놀즈는 ChatGPT를 이용하여 광고의 대본을 작성하여 직접 시연하였고, 의학 논문 관련 웹사이트인 medRxiv에 ChatGPT가 공저자로 실리거나, 영국 맨체스터대 시오반 오코너 교수의 논문에 교신저자로 실리는 일이 있었다.
이와 동시에 ChatGPT의 활용에 관해 다음과 같은 논란이 있다.
- 자연어 처리 모델의 데이터에 편향된 데이터나 잘못된 정보, 개인정보가 포함된 답변 또한 편향되거나 부정확한 답변이 나올 수 있고 개인정보 침해가 발생할 수 있다.
- ChatGPT가 제공하는 정보에 대해 학습자는 판별하는 지식을 갖고 있어야 한다.
- 편향된 데이터를 학습한 경우, 편향된 답변을 출력하고, 잘못된 데이터를 학습한 경우, 부정확한 답변을 출력하고, 개인정보 데이터를 학습한 경우, 개인정보를 침해하는 답변을 출력한다.
- AI 기술은 저작물의 생성, 수정, 복제 등 다양한 작업에 사용될 수 있기 때문에 저작권 문제가 발생할 수 있다. AI가 창작물을 생성한 경우 저작권이 누구에게 있는지가 명확하지 않다.
ChatGPT로 인한 교육 현장의 변화
인공지능 기술을 활용한 학습 과정에서 인공지능에 대한 과도한 의존으로 인간적인 소통능력 약화, 창의력 저하, 문제해결력 저하, 암기 능력 약화가 발생할 수 있다. 특히, 어린 나이에 ChatGPT를 과도하게 사용할 경우 사고를 통해 생각하는 힘을 기르는데 방해가 될 수 있다. 예를 들어, 학생들이 과제를 작성할 때 ChatGPT를 무분별하게 사용할 경우 창의적 글쓰기 능력 발달이 저해되거나 표절과 지식재산권 침해 문제가 발생할 수 있다. 작문, 논술 등의 과제를 집에서 수행할 경우에 학생이 ChatGPT를 사용했는지 여부를 확인하기 쉽지 않은 상황이다.
인공지능 기술이 발전하며 학습자가 지식을 습득하고 기억하는 방식이 변화하고 있지만 여전히 기초지식에 대한 암기, 시험, 교수자와 학습자간 상호작용은 중요하다. 평가 혁신이 필요하지만, 기존 시험을 통해 학습자들은 자신이 습득한 지식을 평가하고, 미래에도 동일한 상황에서 지식을 활용할 수 있는 능력을 키울 수 있도록 지도가 필요하다.
참고로, ChatGPT의 이용약관을 보면, 13살 미만은 사용이 불가능하고, 18세 미만은 부모님의 동의가 필요하다.
ChatGPT 관련 교육 이슈
현재 산업사회형 학교는 "19세기 교실에서 20세기 교사가 21세기 학생을 가르친다."는 문제와, 앨빈 토플러의 말처럼 "하루 15시간 동안, 필요하지 않은 지식, 존재하지 않을 직업을 위해 시간을 낭비"한다는 지적이 있다. AI를 활용한 교육의 혁신은 '여부가 아닌 시기의 문제'이다.
산업사회의 학교에서는 표준화된 교육과정으로 정해진 진도나가기에 집중했고, 경쟁적인 상대평가를 활용하여 학생들의 성취수준을 측정하여 선별 기능을 강조했다. 이에, 학생들 간의 성취수준 격차가 점점 더 벌어지고 있음에도, 이를 보정할 수 있는 시스템적 보완책은 미흡하다. 현재의 학교는 경직된 학교제도, 표준화된 교육과정, 경쟁적인 상대평가, 규격화된 학교 시설 등으로 인해 혁신이 필요한 상황이다.
명문대에 입학한 성공 사례를 근거로 학생들에게 큰 기대와 함께 부담을 주고 있으나 교육과 학습의 실패로 연결될 가능성이 있다. 즉, 학교와 학원은 잘하는 학생을 위주로 모든 것이 세팅되어 있다.
우리는 아인슈타인의 말을 기억해야 한다. 미래 교육에서는, 물고기에게 나무 오르는 법을 평가하는 일은 없어야 할 것이다.
Albert Einstein, “Everybody is a genius. But if you judge a fish by its ability to climb a tree, it will live its whole life believing that it is stupid.”
미래 교육의 방향
예전부터 맞춤형 학습에 대한 요구가 있어 왔다. Bloom(1984)은 일대일 튜터링(one-to-one tutoring)을 받은 학생들의 평균이 전통적 강의식 수업을 받은 학생들의 평균에 비해 2-표준편차(2-sigma)만큼 높다는 것을 발견했다.
기존, 교실의 강의식 수업은 교원, 교육과정, 교육평가, 시설, 재정 등의 한계로 인해 맞춤형 개인별 학습이 어렵다. AI 기술을 활용하여 인적, 물적 자원의 제약 극복할 필요가 있고, 이제는 이것이 가능해졌다.
맞춤형 학습을 통한 완전학습(Mastery Learning)이 구현될 수 있는 시대가 왔다. 완전학습은 적성과 수업이해력, 수업의 질을 높여 학습에 필요한 시간을 줄이고, 학습 기회를 충분히 제공하여 개인별로 학습에 사용된 시간을 늘려주는 것이다.
인공지능 시대의 학습
하는 것만 강조하면 “레시피(recipe)”, 아는 것만 강조하면 “죽은 지식(inert)”이다. 가장 바람직한 것은 “전이(transfer)”력이 높은 지식이다. 즉, 학생들이 학교에서 배워야 할 지식은 학생들이 선택하게 될 세부적인 전공이나 문제 해결을 위한 다양한 방법에 적용(transfer)될 수 있는 지식이다.
모라벡의 역설(Moravec’s Paradox)은 “인간에게 쉬운 일이 컴퓨터에게 어렵고, 컴퓨터에게 쉬운 것이 인간에게는 어렵다.”고 말한다. 컴퓨터는 인간보다 반복적으로 예측하는 일, 정확한 계산에 의존하는 일, 대규모 데이터와 입력 정보를 분류하는 일, 확정된 규칙에 따라 기계적 의사결정을 하는 일 등을 잘한다. 인간은 컴퓨터보다 감정을 경험하고 관계를 형성하는 일, 복잡한 출처를 활용하여 답변하는 일, 제한된 자원을 전략적으로 사용하는 방법을 결정 하는 일, 제품을 생산하고 그 결과 활용에 대해 소통하는 일, 추상적인 가치와 관련된 문제에 대한 의사결정 등을 잘한다.
기존 교육은 Remember와 Understand만 강조한다. 미래 교육은 더 나아가 Apply, Analyze, Evaluate, Create 등 고차원적인 학습을 해야 한다.
구체적으로, 플립러닝(Flipped Learning)을 도입해볼 수 있다.
AI 보조 교사의 도입
기존 교육의 문제는 다음과 같다.
위의 문제를 해결하기 위해, AI 보조교사를 다음과 같은 방법으로 도입할 수 있다.
이때, ChatGPT는 Copilot(부조종사), 멋진 말, 멋진 자동차와 같은 것이다. 이를 잘 다루기 위해서는 좋은 조종사, 기수, 운전사가 되어야 하는데, 결국 좋은 도구를 잘 쓸 수 있는 역량이 있어야 한다. 참고로, ChatGPT의 답변 중 10~20%는 거짓 정보인데, 이를 잘 구별할 수 있는 역량이 필요하다. 이때문에 ChatGPT에게 잘 질문하는 방법을 연구하는 Prompt Engineering 분야가 생겨났고, Prompt Engineer라는 직업이 생겼다.
ChatGPT를 제대로 활용하려면
ChatGPT를 제대로 활용하려면 다음과 같은 것을 잘 해낼 수 있어야 한다.
- 본인이 궁금한 것을 정확하게 질문으로 표현하기
- ChatGPT의 답변의 정확성을 판단하기
- 창의적 관점에서 자료를 재구성하기(Editology)
- 본인이 작성한 자료의 의미를 제대로 설명하기
이를 위해 필요한 6가지 역량과 해당 역량을 강화할 수 있는 방법은 다음과 같다.
- 개념적 지식 기반의 판단력 → 독서
- 커뮤니케이션 역량 → 질문, 설명
- 실제 문제해결능력 → 적용, 활용
- 창의성과 인문학적 상상력 → 독서, 예술활동 참여, 지속적인 노력과 시간 투자, 새로운 경험 축적, 비판적 사고 및 탄력성 강화
- 디지털 리터러시와 시민의식 → 컴퓨터 및 인터넷 교육, 안전한 인터넷 환경 조성, 윤리적인 인터넷 사용, 사회 참여와 협업, 피드백
- 자기주도학습 역량 → 명확한 목표 설정과 계획을 세우고, 실행해 나가며 평가와 피드백 받기, 새로운 방법 시도 및 자신을 동기부여하는 방법 찾기, 다른 사람들과의 협력
ChatGPT의 교육적 활용 예시
- 수업 설계
- 학습 목표와 내용 설정 : (예시) 중학생을 대상으로 '교육혁신에 대한 이해'라는 목표에 맞는 학습 내용을 구성해주세요.
- 학습 자료의 구성 : (예시) 교육혁신이 필요한 이유에 대한 학습 자료를 만들기 위한 키워드를 추출해주세요. 교육 시스템의 한계에 대해 설명해주세요.
- 맞춤형 학습 자료의 제공 :(예시) 초등학교 5학년 수학 약수와 배수 문제와 답 해설을 만들어 주세요.
- 수업 지원
- 교육 내용 개선 지원 : (예시) 학교폭력의 조기 감지와 예방에 대한 학습 목차입니다. ~ 목차에서 추가되어야 할 부분이 있습니까?
- 교수법 개선 지원 : (예시) 분수의 개념을 초등학생에게 가르치기 위한 효과적인 교수법은 무엇입니까?
- 수업 중 개별적 피드백 제공 : (예시) 학생이 다음과 같이 의견을 작성했습니다. 주장에 대해 피드백해주세요. "학생의 주장"
- 학습자 면담 지원 : (예시) 학생들의 학업 스트레스 관리 지도를 위해 교수자가 학생에게 어떤 질문을 하면 좋을까요?
- 평가 지원
- 진단, 형성평가 지원 : (예시) 초등학교 고학년 수학 교과 관련 프로젝트 그룹 수행을 위한 주제를 알려주세요.
- 학습 성과 관리 : (예시) 중학교 2학년의 사회교과목에서 문제 해결역량을 점검할 수 있는 문항을 개발해 주세요.
- 효과적인 강의 평가 및 개선 : (예시) 강의 평가 결과 교수자의 강의 스타일이 흥미롭지 않았다는 의견이 많았습니다. 개선할 점을 알려주세요.
- 피드백
- 인지적 영역에서의 피드백 : (예시) 상상력이 뛰어난 학생이 있습니다. 영어 단어 암기에 어려움을 겪고 있습니다. 어떤 학습방법을 소개시켜 주는 것이 좋겠습니까?
- 심리 : (예시) 학습된 무기력을 겪는 학생들을 지도할 수 있는 방법을 알려주세요.
교과별 활용 사례
- 수학 : 수학 문제 풀이는 가능하지만, 그래프나 그림 그리기는 불가능
- 과학 : 실험 방법 제시에 활용할 수 있으나, 번역 오류 조심
- 역사 : 세계사는 비교적 정확하지만, 한국사는 부정확함
- 철학 : 철학 이론 질문에 활용
- 예술 : 외국 작품은 비교적 정확하지만, 한국 작품은 부정확함
- 외국어 학습 : 가장 많이 활용되는 분야
- 프로그래밍 언어 학습 : 원하는 기능에 대한 코드 요청하기, 간단한 코드로 변환 요청하기, 코드의 오류 분석 요청하기
참고 도서
<챗GPT 교육혁명 : ChatGPT를 활용한 하이터치 하이테크 미래교육>
<AI 교육혁명 : 무엇을 배우고, 어떻게 가르쳐야 하나?>
<인공지능 시대의 미래교육>
댓글