챗GPT 훈련을 위해 온라인 개인정보를 무단으로 수집한 후 소송을 당한 OpenAI

챗GPT 훈련을 위해 온라인 개인정보를 무단으로 수집한 후 소송을 당한 OpenAI

ChatGPT를 훈련하기 위해 다량의 개인정보를 수집하여 사용한 OpenAI와 후원사 마이크로소프트가 소송을 당했다.

 

미국 캘리포니아 북부 지방 법원에 제출된 송장은 OpenAI가 “개인정보의 구매와 사용에 대해 확립된 프로토콜에도 불구하고, 피고인들이 다른 접근법을 취했습니다”라고 기록하고 있다.

 

157페이지 길이의 송장에 따르면, OpenAI는 주요 소셜미디어 사이트를 포함하여, 엄청난 양의 데이터를 수집하기 위해 웹사이트를 탐색했다. 예를 들어 OpenAI는 WebText2를 통해 레딧 게시물과 레딧 게시물의 링크가 연결된 웹사이트의 데이터를 무단으로 스크랩했다.

 

수집된 데이터에는 “개인정보 및 개인적인 대화, 의료 데이터, 어린이에 대한 정보 등 인터넷상에서 주고받는 모든 데이터”가 포함되어 있다. OpenAI는 데이터 수집 과정에서 데이터 사용자나 소유자의 승인을 요청하거나 수집을 알리지 않았다.

 

OpenAI는 심지어 OpenAI 계정을 만들기 위해 사람들이 입력한 내용, 채팅 로그 데이터, 소셜미디어 정보 등의 개인정보까지 활용하고 있고, 여기에는 스냅챗, 스트라이프, 스포터파이, 마이크로소프트 팀, 슬랙의 앱에서 ChatGPT를 사용하고 있는 사람들의 개인정보도 포함된다.

 

이번 집단 소송은 ChatGPT의 상업적인 접근 및 개발을 중지하여 OpenAI가 자체적으로 규정을 만들고 안전장치를 준비하게 하여 ChatGPT 사용자들을 포함한 개인정보를 도난당한 모두에게 해를 끼치는 행위를 중단하고 피해를 배상할 것을 요구하고 있다.

 

원고 측은 AI 플랫폼이 의심의 여지 없이 세상에 많은 선을 행할 수 있는 잠재력을 지니고 있지만, 악의적으로 사용될 경우에는 인류에게 잠재적으로 재앙적인 위험을 초래할 수 있다고 경고했다.

 

“우리는 우리 사회 구조 자체가 수십억 달러의 이익을 추구하는 기업들에 의해 해체되는 불합리한 위험에 직면해 있습니다. 비길 데 없는 고도로 집중된 기술력으로 무장한 강력한 기업들이 기술 발전을 명분으로 인류에 미칠 재앙적 위험을 무시하고 AI 기술을 출시하기 위해 무분별하게 경쟁해 왔습니다.”

 

ChatGPT 제작자들은 ChatGPT가 향후 10년 이내에 대부분의 분야에서 인간의 전문 지식을 능가할 것으로 예상하고 있다. OpenAI가 인터넷에서 훔친 단어 수는 3천억 개로 추정되고 있다.

 

 

Source :

Share this post