2. '데이터 라벨러' 직업을 알아봐요
핵심 개념
인공지능, 데이터, 정보통신활용
활동 개요
“데이터 라벨러”라는 직업에 대해 알아보고 해당 직업을 갖기 위해 필요한 역량이 무엇이 있는지 알아 볼 수 있습니다.
인공지능
영역
인공지능의 이해 인공지능 원리와 활용 인공지능의 사회적 영향
인공지능과 사회 인공지능과 에이전트 데이터 인식 분류,탐색,추론 기계학습과 딥러닝 인공지능 영향력 인공지능 윤리
2015 교육과정 성취기준

[9진로02-03] 자신의 직업 흥미와 적성 등 직업 선택 시 고려해야 할 사항을 살펴봅니다.

[12진로02-02] 지역사회의 다양한 직업들 가운데 미래 유망 직업을 탐색하고 미래 직업인의 자세와 능력을 갖춥니다.

준비물 : 다양한 데이터 자료, 필기도구
학습 활동
도입
“데이터 라벨러” 교육이 궁금해요
학습형태 : 전체학습
활동1
데이터 가공에 대해 알아봐요

과일 사진을 보고 이름 알기

데이터를 가공하는 이유 알기

학습형태 : 개별화, 수준별 학습
학습자료 : 활동지 2-1
활동2
데이터 라벨링 필요성을 알아봐요

데이터 라벨링 알아보기

데이터 라벨링 필요성

데이터 라벨링의 어려움과 교육의 필요성

학습형태 : 개별화, 수준별 학습
학습자료 : 태블릿, 노트북
활동3
"데이터 라벨러” 되는 방법을 알아봐요

미래 일자리 “데이터 라벨러”

최근 “데이터 라벨러” 현황

라벨라가 되기 위한 교육

학습형태 : 전체학습
정리
학습한 내용을 확인해 봐요

데이터 라벨링 방법 알아보기

학습형태 : 전체학습
활동 팁

“데이터 라벨링”, “데이터 라벨러”라는 새로운 용어가 등장하게 됩니다.

학생들이 해당 용어에 대해 어려움이 있을 때 다양한 예시를 통해 이해할 수 있도록 합니다.

지도안 다운로드

시작해요“데이터 라벨러” 교육이 궁금해요
(TV화면에서 일자리 홍보 화면이 보임) 남학생: 저 광고 봤어? 여학생:뭔데? 데이터 라벨러 교육?
학생 모두: 선생님, 저건 뭐에요?
                                 남,여학생: 직업교육 홍보 광고구나 교사: 데이터 라벨러는 최근 인공지능이 활성화 되면서 필요한 데이터를 가공하는 직업이란다.
여학생: 선생님께서 말씀하신 데이터가 지난 시간에 배운 데이터를 말하는 거죠? 교사: 맞아. 그럼 오늘은 데이터를 가동하는 방법과 데이터 라벨러에 대해 알아볼까요?

【학습 목표】

1. 데이터를 가공하는 이유에 대해 알 수 있습니다.

2. “데이터 라벨러” 직업을 알 수 있습니다.

활동
1데이터 가공에 대해 알아봐요

▷ 다음 그림을 보고 과일의 이름을 말해봅시다.

사과사진 수박사진

맞아요. 사과와 수박입니다.

여러분들은 어떻게 사과와 수박이라는 것을 알 수 있을까요?

▷ 다음 과일은 무엇인지 말해봅시다.

용과사진 두리안사진

잘 모르겠나요?

바로 [용과]와 [두리안]이라는 과일입니다.

이렇게 사진을 보고 모르는 것에는 이름을 적어줘야 합니다.

새 학년이 되어 선생님과 친구들을 처음 만나게 되면 서로 이름에 대해 알아보는 것은 상대방에 대해 모르는 것을 알기 위해서입니다. 이렇게 데이터를 가공한다는 것은 데이터 속 모르는 것에 이름을 붙여가는 것입니다.

▸처음 제시된 과일은 학생들이 자주 접하는 것을 제시하여 이름을 알아보고 다음에 제시된 과일은 학생들이 모르는 이색과일을 준비해 이름을 중요성을 알도록 지도합니다. ▸학생들의 [용과]와 [두리안]을 알 경우 특이한 과일을 추가적으로 제시합니다.

▷ 데이터를 가공해야 하는 이유를 알아봅시다.

데이터를 가공하는 이유는 인공지능의 학습 결과의 정확도를 높이기 위해서입니다.
다음 사진을 보고 강아지를 찾아봅시다.

강아지와 머핀 사진들

여러분들은 강아지를 쉽게 찾을 수 있지만, 인공지능의 경우 머핀과 강아지를 구별하지 못하는 문제점이 발견되었습니다.
이는 가공된 데이터의 양이 부족하기 때문입니다.

위의 사진 데이터에 강아지와 머핀으로 이름을 붙이는 가공을 한 뒤 인공지능이 학습하게 하도록 하면 그렇지 않았을 때보다 높은 확률로 강아지를 찾아낼 수 있습니다.

인터넷을 하다보면 사진과 같이 본인 확인 및 사람인지 확인하기 위한 다양한 방법들이 있습니다.

암호문자 사진 영수증 사진

이를 통해 사람인지 컴퓨터 프로그램인지 구별하기 위해 사용되는 것을 캡챠(CAPTCHA)라고 합니다.
사람은 구별할 수 있지만 컴퓨터는 구별하기 힘들게 의도적으로 비틀거나 덧칠한 그림을 주고 그 그림에 쓰여 있는 내용을 물어보는 방식입니다.

이렇게 인공지능이 정확한 판단을 하기 위해서는 데이터를 가공하는 작업이 필요합니다.

[활동지 2-1] 캡챠(CAPTCHA)를 체험 해봐요

▷ 다음 그림을 보고 [버스]가 있는 이미지를 모두 선택하세요.

버스 이미지 찾기 사진

▷ 다음 그림을 보고 [횡단보도]가 있는 이미지를 모두 선택하세요.

횡단보도 이미지 찾기 사진

활동지 다운로드

활동
2데이터 라벨링 필요성을 알아봐요

▷ 데이터 라벨링 알아보기

활동1에서 알아본 것과 같이 사람이 사용하는 문서, 사진 등의 데이터를 AI가 스스로 학습할 수 있는 형태로 가공하는 작업을 [데이터 라벨링]이라고 합니다.

남자가 노트북앞에 앉아있는 사진

▷ 데이터 라벨링 필요성

스마트폰이 보급되면서 세상에 데이터는 흘러넘치고 있습니다.
하지만 역설적으로 인공지능 시대에 인공지능 프로그램을 개발하기 위한 데이터가 매우 부족한 상황입니다.
이를 좀 더 자세히 말하면 “데이터 라벨링”된 데이터의 부족이라고 표현할 수 있습니다.

수많은 데이터들

▷ 데이터 라벨링의 어려움과 교육의 필요성

많은 양의 데이터

많은 양의 데이터

많은 비용

많은 비용

인공지능이 학습하기 위해서는 많은 양의 데이터가 필요한데, 이미지를 분류 할 때 최소 수천, 수만 장의 이미지가 요구됩니다. 이는 시간을 포함한 많은 비용이 들게 됩니다. 또한 해당 데이터 라벨링 작업은 정확성이 필요합니다.

다음 이미지를 봤을 때 무엇이 떠오르나요?

두 사람 마주보는 그림자 사진

데이터에 대한 다양한 의견 발생

사람의 얼굴 옆모습 또는 유리잔이라는 통일되지 않은 의견이 발생하게 됩니다.

이는 여러 사람들이 데이터 라벨링을 할 때 기준이 없다면 일관되고 정확한 라벨링 작업이 어려워진다는 것을 의미합니다. 그렇기 때문에 데이터를 정확하게 라벨링 하는 교육이 필요합니다.

활동
3“데이터 라벨러” 되는 방법을 알아봐요

▷ 미래 일자리 “데이터 라벨러”

데이터 라벨러는 직업, 나이, 성별, 학력에 상관없이 일반적인 컴퓨터 작업에 무리가 없다면 누구나 할 수 있습니다. 또한 장소, 시간의 제한을 받지 않는다는 점은 타인과의 소통에 어려움을 겪는 장애인에게 새로운 직업의 대안이 될 수 있습니다.

다만 비정기적인 과업으로 주된 직업으로의 어려움이 있으며 PC와 휴대폰을 다룰 수 있는 정보통신기기 활용 역량이 없을 경우 적합하지 않습니다.

▷ 최근 “데이터 라벨러” 현황

인공지능이라는 사회적 변화에 따라 다양한 교육 기관들을 통해 데이터 라벨링 교육을 실시하고 있습니다. 비장애인들 중심으로 진행되면 교육은 최근 장애인들의 새로운 미래 일자리로 관심을 받게 되었습니다.

2021년에 서울특별시 사회적경제지원센터에서는 발달장애인 데이터 라벨러 교육생을 50명 모집하였으며 중구장애인복지관에서 데이터 라벨러 전문가 양성교육을 실시했습니다. 기사보기 : 1) 서울특별시 중구장애인복지관

광주발달장애인지원센터와 함께 광주지역 발달장애인(5명)에 대해 “데이터 라벨링” 교육을 실시하였습니다. 기사보기 : 2) 광주광역시

또한 한국장애인고용공단 부산지역본부는 장애인 인공지능데이터 전문가 양성사업 추진을 위한 업무협약을 통해 부산, 울산, 경남에 거주하는 장애인 대상 ‘AI 데이터 라벨러 양성과정’교육을 진행하였습니다. 기사보기 : 3) 한국장애인고용공단 부산지역본부

경북 경희학교에서는 전공과 3명의 학생이 교육을 받은 후 근로계약서를 통해 취업에 성공했습니다.
기사보기 : 4) 경희학교 학생 데이터 라벨러 취업기사

2022년에도 한국장애인고용공단 서울본부는 서울지체장애인협회와 업무협약을 진행하고 올 연말까지 장애인 데이터 라벨러 120명을 배출한다는 계획을 발표했습니다. 기사보기 : 5) 한국장애인고용공단 서울본부 및 서울지체장애인협회

▷ 데이터 라벨러가 되기 위한 교육

데이터 라벨러가 되기 위해서는 다양한 데이터 라벨링 방법과 해당 직무 역량을 높이는 교육을 받아야 합니다.

데이터 라벨링 하는 도구의 경우 다양하게 존재하고 도구에 따라 데이터 라벨링 방법이 다르기 때문에 다음 제시하는 데이터 라벨링 명칭은 다를 수 있습니다.

바운딩박스 사진
바운딩 박스
폴리곤 어노테이션 사진
폴리곤 어노테이션
핸즈 어노테이션 사진
핸즈 어노테이션
바디 어노테이션 사진
바디 어노테이션
페이스 어노테이션 사진
페이스 어노테이션
폴리라인 어노테이션 사진
폴리라인 어노테이션

위의 데이터 라벨링 방법 외 다양한 데이터 라벨링 방법이 있습니다.

데이터 라벨링에 대한 간단한 소개 영상 썸네일
정리해요학습한 내용을 확인해 봐요

▷ 데이터 라벨링 방법 사진을 보고 해당되는 명칭과 바르게 연결해 보세요.

바운딩 어노테이션
◉ 핸즈 어노테이션
핸즈 어노테이션
◉ 바운딩 박스
폴리곤 어노테이션
◉ 폴리곤 어노테이션
개념 쏙쏙
1
인공지능이 정확한 판단을 하기 위해서는 가공된 데이터가 필요합니다.
2
문서, 사진 등의 데이터를 인공지능이 스스로 학습할 수 있는 형태로 가공하는 작업을 데이터 라벨링이라고 합니다.
3
데이터 라벨러가 되기 위해서는 다양한 데이터 라벨링 교육을 받아야 합니다.

확인해요

평가 내용 평가 결과
데이터 라벨링에 대해 설명할 수 있나요?
“데이터 라벨러” 직업에 대해 알아보고 자신이 할 수 있는지 생각해봤나요?