SCIENCE INSIDE

생생 과학수업 노하우 과학 데이터를 활용한 AI 융합 수업 프로그램

페이지 정보

본문

과학과 인공지능이 만나는 융합 수업
학생들 문제해결 능력 돕는다


데이터 리터러시란 관찰이나 측정을 통해 얻은 데이터를 이해하고 수집·분석하여 활용하고, 그 결과를 효과적으로 소통할 수 있는 능력을 말한다. 데이터 리터러시를 “문제 해결을 위해 데이터를 수집하고 분석 및 활용하여 정보를 만들어내는 지식 구성과 의사소통의 기초 능력”(송유경 외)으로 정의하기도 했다. 즉, 필요한 데이터를 찾고 평가하며, 이를 바탕으로 새로운 지식을 만들어내고 공유할 수 있는 역량을 포괄하는 개념이다. 데이터 리터러시가 중요한 이유는 현대의 문제 해결이 데이터 기반 의사결정에 크게 의존하고 있기 때문이다. 복잡한 문제일수록 객관적 데이터에 근거한 분석과 판단이 필요하며, 이를 뒷받침하는 데이터 소양이 부족하면 올바른 해결책을 찾기 어렵다. 특히 단순히 데이터를 읽고 해석하는 능력뿐만 아니라, 데이터를 활용한 의사소통과 협업 능력이 강조되고 있다. 최근의 교육 연구 동향을 보면 데이터 분석 능력과 함께, 데이터를 기반으로 타인과 소통하고 공동으로 문제를 해결하는 역량을 데이터 리터러시의 핵심 요소로 포함시키는 추세이다. 이는 학생들이 향후 실제 삶과 직업 현장에서 데이터로 소통하고 협력하는 상황에 대비할 수 있도록 가르쳐야 함을 시사한다.


과학교육에서 데이터와 AI 모델링의 역할


과학교육에서도 데이터 리터러시는 중요한 위치를 차지한다. 과학수업에서 학생들은 실험과 관찰을 통해 데이터를 수집하고, 그 데이터를 해석하여 자연현상의 모델을 구축하거나 과학적 개념을 이해하게 된다. 이러한 과학적 모델링 과정은 과학자의 연구 활동과 맥락을 같이하며, 데이터를 근거로 가설을 세우고 검증하는 과학 탐구의 핵심이다. 따라서 과학수업을 통해 학생들은 자연스럽게 데이터 다루는 법을 배우고, 이를 토대로 과학적 사고력을 키우게 된다. 특히 AI 시대를 맞아, 과학교육에서도 인공지능 모델링의 개념을 도입할 필요성이 커지고 있다. AI 기술은 방대한 데이터를 학습하여 예측 모델을 만들어내는 데 강점이 있는데, 이를 교육적으로 활용하면 학생들에게 새로운 형태의 모델링 경험을 제공할 수 있다. 예를 들어, 과거에는 교사가 준비한 완성된 과학 모형을 이해하는 데 그쳤다면, 이제는 학생들이 직접 머신러닝 모델을 만들어 보는 활동까지 확장할 수 있다.


고등학생 수준의 과학교육에서는 직접 데이터를 이용해 AI 모델을 만들어보는 경험이 요구된다. 실제로 국내 AI 교육 연구를 살펴보면, 2020년 이후 AI 융합교육에 관한 연구가 빠르게 증가했지만 고등학생을 대상으로 한 사례는 매우 적은 편이므로 심화된 데이터 활용 능력을 기르기 위해, 학생들이 다양한 AI 모델을 직접 구현해 보는 교육 프로그램이 필요하여 과학 데이터 기반 고등학교 과학 AI 융합 수업 프로그램을 설계하여 실천해 보았다.

pH 데이터셋을 이용한
AI 모델링 과정


이 프로그램은 공개된 과학 데이터셋을 활용하여, 지도학습의 하나인 회귀 알고리즘으로 용액의 pH(산성도)를 예측하는 인공지능 모델을 학생들이 직접 만들어보는 내용을 담고 있다. 프로그램의 설계에는 탐색적 과학 데이터 분석(ESDA) 모형이라는 과학 탐구 모형의 원리(손미현)가 적용되었다. ESDA(Exploratory Scientific Data Analysis) 모형은 과학 탐구 과정에 데이터 분석 절차를 통합한 것으로, 학생들이 데이터를 탐색하고 분석하여 과학적 의미를 도출해내는 일련의 단계를 체계화한 모델이다. 이 모형에 따라 프로그램은 데이터 수집 → 변환 및 해석 → 모델링 → 활용의 과정을 거치도록 구성되었다. 구체적으로, 첫 번째 단계에서 학생들은 데이터 수집 활동을 수행한다. 예를 들어 여러 용액의 pH에 따른 색 변화를 나타내는 만능지시약 실험을 통해 다양한 시약의 이미지를 얻고, 이를 컴퓨터로 불러들여 RGB 색상 데이터를 추출하였다. (표 1 )


이 과정에서 어떤 색상 변화가 어떤 pH 범위와 관련되는지 토의하며, 데이터 관리(정리·저장)와 데이터 해석 능력을 기르게 된다. 예컨대, 산성에서 염기성으로 갈수록 용액 색깔의 RGB 조합이 어떻게 달라지는지 학생들 스스로 발견해내는 것이다.


다음 단계에서는 모델링 단계로, 보다 큰 규모의 데이터셋을 활용해 AI 예측 모델을 만들어 보는 활동이다. 학생들은 온라인에서 공개된 pH 관련 빅데이터셋을 활용하여, 머신러닝 기법으로 산성도와 색상 간의 수학적 관계를 학습하는 회귀 모델을 개발하였다. 데이터 사이언스를 위한 플랫폼(https://www.kaggle.com/)에 공개된 수백 개 이상의 pH-색상 데이터를 불러와서, 파이썬의 머신러닝 라이브러리로 모델을 학습시킨다. 이렇게 함으로써 학생들은 데이터의 패턴을 일반화하여 새로운 입력에 대한 예측값을 산출하는 인공지능 모델링 과정을 직접 경험하게 된다.( 그림 1, 그림 2 )


이는 데이터 분석 및 활용 역량을 키우는 고차원적인 단계로서, 기존 교과서 실험으로는 접하기 어려웠던 경험이다. 마지막 단계에서는 모델의 활용 및 결과 응용 활동이 이루어진다. 학생들이 만든 머신러닝 모델을 사용하여 미지의 용액의 pH를 예측해 보고, 그 결과를 실제 화학 실험을 통해 검증하거나 해당 용액의 수소 이온 농도([H3O⁺])를 계산해 보는 것이다. 예컨대, 모델이 예측한 pH 값과 학생들이 직접 지시약으로 확인한 실험 결과를 비교하며 토의함으로써, AI 모델의 유용성과 한계를 비판적으로 평가해 보는 학습도 이루어졌다. 이처럼 예측 모델의 현실 적용 과정을 거침으로써 학생들은 데이터를 이용한 문제 해결의 전 과정을 체험하고, 데이터 평가 및 의사소통 능력까지 아우르는 종합적인 데이터 리터러시 경험을 쌓을 수 있었다.


다만 이 프로그램은 과학적으로 정확성을 요구하는 과정은 아니고, 이미지를 데이터로 변환시킬 수 있다는 점과 색변화를 일으킬 수 있는 용액의 종류에 제한이 있다는 것, 디지털 기기들의 이미지 센서의 기능에 따른 차이가 발생할 수 있다는 점에서 한계가 있다. 따라서 과학적 원리를 이해하는 것 보다는 다양한 관점에서 과학 실험의 데이터를 해석하고 이를 AI를 활용하여 자신만의 모델링의 경험을 해보는 데 의의가 있다고 할 수 있다. 또한 인앱으로 구성하여 학생들이 휴대전화에서 사진만 찍으면 pH를 예측해 낼 수 있는 과정으로 확장해 볼 수도 있는 등 다양한 영역에서의 확장도 가능하다.


프로그램의 개발 과정에서는 생성형 AI가 등장하지 않았으나,최근에는 생성형 AI의 코딩 능력이 매우 뛰어나게 향상되어 가고 있으므로 데이터 플랫폼에서 데이터를 얻거나 데이터를 직접 얻는 과정과 이를 활용한 AI 모델링은 이전보다 손쉽게 이루어지고 있다. 데이터를 활용할 수 있는 과학 수업에서 이를 적극적으로 활용해 보는 것을 제안해 본다.


노동규 교사는 서대문구 인창고등학교에서 20년 동안 화학 교사로 재직하였고, 서울대학교 대학원 AI 융합교육학과에서 석사학위를 받았다. 07개정, 15개정, 22개정 교과서 외 다수의 참고서를 집필하였고, 서울시교육청 학생평가지원단, 에듀테크 선도교사로 활동하면서 디지털 기반의 과학교육에 발전을 위해 노력하고 있다.