본문 바로가기
N잡

데이터 라벨러란 무엇인가?

by 시온사랑 2023. 2. 15.
반응형

인공지능

인공지능을 학습시키는 데이터라벨링에 대해 알아본다. 

데이터라벨링이란?

인공지능 알고리즘 고도화를 위해서는 다양한 데이터를 주입해야 하는데, 인공지능은 사람이 사용하는 문서나 사진을 식별할 수 없다. 이 때문에 인공지능이 스스로 학습할 수 있는 형태로 데이터를 가공하는데, 이러한 작업을 데이터라벨링이라고 하고 이 일을 하는 사람을 데이터라벨러라고 한다. 

예를 들어 강아지나 고양이 사진이 있는 경우 인공지능은 이미지 자체만으로 강아지나 고양이를 구분할 수 없으며, 사람이 이를 네모 박스를 그려주고(바운딩 작업) 강아지나 고양이라고 라벨을 붙여주면 인공지능이 이를 학습할 수 있다. 데이터라벨러는 단순히 한가지 작업만을 하지 않고 데이터의 수집부터 가공과 관련해서 다양한 작업들이 필요하다. 

데이터라벨러란?

데이터라벨러는 데이터 가공작업을 하는 사람을 말한다. 2022년 고용노동부 직업사전에 등재되었으며 신생 직업으로 인정받고 있다. 데이터수집, 바운딩, 폴리곤, 스켈레톤, 감정추론, 태깅, 음성전사 등 다양한 작업을 수행한다고 직업사전에 설명되어 있다. 

데이터라벨러는 플랫폼 종사자(크라우드워커)라 하는데 이는 "계약의 명칭이나 형식에 관계없이 온라인 플랫폼에서 자신의 노무를 제공하고 그 대가로 보수를 얻는 사람"이라고 한다. 

작업의 종류

데이터라벨러의 장, 단점 및 미래

장점 : 가장 큰 장점은 재택근무가 가능하다는 것이다. 전업주부, 직장인의 부업, 대학생의 아르바이트, 어르신들의 노후 일자리로 활용되고 있다. 

단점 : 국내에서는 산업 특성상 정부과제, 데이터바우처 사업 형태로 진행되고 있어 하반기에 일자리가 몰려 있다. 그래서 현재 나도 열심히 데이터라벨링에 대한 교육만 듣고 있는 실정이다. 

전 세계적으로 인공지능의 수요는 높아지고 빅데이터를 산업에 활용하는 모습을 쉽게 볼 수 있다. 4차 산업과 관련된 자율주행, 메타버스등과 관련된 산업에 많이 필요하다. 이러한 수요로 인해 인공지능 사업 분야는 계속 성장할 것이다. 2022년 66억 달러 규모였던 인공지능 시장은 24% 이상 성장하여 2028년쯤에는 370억 달러까지 성장할 것으로 보고 있다. 

인공지능 산업이 성장하면서 많은 데이터가 필요하게 되고 데이터라벨러의 수준도 높아질 것이다. 그만큼 데이터라벨러도 보다 전문적인 역량이 요구될 수 있으므로 다양한 프로젝트를 경험하여 데이터라벨링에 대한 이해도를 높여야 할 것이다. 

데이터라벨러가 되려면

데이터라벨링을 경험할 수 있는 여러 사이트가 있고 각 사이트마다 운영방식이 다르다. 나의 경우에는 크라우드웍스에 가입하여 기준에 준하는 교육을 이수 후 라벨링 작업을 시작 하였다. 

한국인공지능협회에서 주관하는 데이터라벨링 자격증도 있다. AIDE 2급, AIDE 1급이 있다. 온라인으로 개설된 강의를 통해 편리하게 배울수 있다. 처음에는 익숙하지 않은 일이라 수익이 작지만 본인의 능력이 올라가면 그만큼 수익도 많아진다. 현재 내일배움카드로 수강할 수 있는 교육이 있으므로 관심 있으신 분들은 한번 시작해보길 바란다. 

반응형

'N잡' 카테고리의 다른 글

2023년 손해평가사 시험 일정  (0) 2023.03.13
데이터라벨링 교육  (0) 2023.03.04
2023년 청년도약계좌 신청  (0) 2023.02.28
2023년 크라우드웍스X고용노동부 교육  (0) 2023.02.18
내일배움카드 신청하기  (0) 2023.02.17

댓글