본문 바로가기
비즈니스 뉴스 공유

레딧의 개인정보 판매: 구글과의 800억 규모의 계약

by Ryan Yoon 2024. 3. 29.
728x90


TL;DR

  1. FTC 조사 개시: 미국 연방무역위원회(FTC)가 레딧을 비롯한 회사들이 AI 모델 교육을 위해 사용자 생성 콘텐츠를 제3자와 판매, 라이센스 또는 공유하는 것에 대해 조사를 시작했습니다. 이는 개인 정보 보호 위험, 공정성 및 저작권 문제에 대한 국회의원과 권리 단체의 우려를 반영합니다.
  2. 레딧의 데이터 사용 논란: 레딧은 사용자의 동의 없이 170억 개의 게시물과 댓글을 AI 학습에 활용했다는 지적을 받고 있습니다. 이와 별개로 구글과 연간 6000만 달러 규모의 저작권 계약을 맺었습니다, 레딧 데이터의 AI 학습 및 연구 목적 사용에 대한 중요성을 강조하면서도, 이로 인해 사용자 데이터 활용에 대한 논란과 소송에 직면해 있습니다.
  3. AI 학습 데이터의 미래: 레딧과 같은 SNS 및 온라인 커뮤니티 데이터의 AI 학습 목적 사용은 진정한 콘텐츠 소유권자 문제와 개인 데이터 유출 가능성 등 복잡한 문제를 제기합니다. 이는 레딧의 상장 계획과도 연관되어 있으며, AI 학습 데이터의 저작권 및 사용권 관련 논란으로 확대될 가능성이 있습니다.

블록체인이 엮일 수 있는 부분

레딧이 SNS 데이터를 구글에 제공하고 있었네요. 대략 연단위 계약으로 800억 규모의 대형 저작권 계약을 맺고있었다고 합니다. 앞으로도 과연 플랫폼의 데이터는 누구의 것이냐는 문제는 계속해서 나올 것이고, AI를 위한 데이터를 생성, 확보하는 중요한 이슈로 떠오를 것으로 생각됩니다.

자연스럽게, 블록체인과도 엮어질 것 같습니다. 데이터의 주권을 확보하는 가장 좋은 방법이 탈중앙화니까요. 우리가 현재는 블록체인이 왜 필요하지 싶겠지만. 이러한 상황들이 연속되면서 데이터의 주권을 사수해야한다는 인지적 변화가 이루어지면. 그때쯤 필요성을 느낄 수도 있겠다는 생각이 드네요.

이념적으로 데이터의 주권은 생성자에게 있다

데이터의 주권이 생성자에게 있다는 원칙하에, 레딧과 구글의 계약은 문제가 있다고 봅니다. 특히 이번 계약으로 발생한 800억 규모의 레딧의 수익은 생성자들에게 일부 돌아 갔어야 한다고 생각합니다. 결국 데이터 제 3자 제공 이전에 데이터 판매수익을 공유할 고객층을 따로 모집하고, 동의한 이들의 데이터만 판매하고 수익을 나누는 모습으로 변화해야 하지 않을까 싶습니다. 

SNS를 학습한 생성형 AI도 위험 하지 않을까 싶습니다. 아무래도 SNS에서 바이럴이 되는 글은 자극적이고, 갈등을 유발할 수 있는 이야기가 다수라고 생각합니다. 특히 이런 데이터를 학습한 AI가 게시글을 사람들 속에 섞여서 게시한다고 생각하면… 사람들간의 갈등, 사회문제 조장등 나쁜 영역에도 많이 사용되어 위험하지 않나 싶네요.

법적으로도 그럴까?

많은 플랫폼에서 판매하는 것이 아닌가라는 의심을 받는데, 레딧은 실제로 판매를 했네요. 그리고 이 부분에 대해서 소송이 걸린다면, 상장을 앞두고 있는 현재 레딧의 상장에 큰 위기가 올 것입니다.

약관을 살펴보면 Your Content available for distribution by other companies 라는 문구가 있어 사실상 문제는 없을 것 같습니다. 하지만 과거 다뤘던 이루다의 경우와 같이 개인 정보가 포함된 경우 이는 새로운 문제가 될 수 있다는 점은 유의해야할 것입니다.


https://www.aitimes.com/news/articleView.html?idxno=158026

 

AI '학습 데이터' 문제 SNS로 확대되나... FTC, 레딧 조사 - AI타임스

인공지능(AI) 학습을 위해 인터넷 커뮤니티나 SNS의 게시물을 사용하는 것에 대한 문제가 떠올랐다. 이제까지 관련 기업은 사용약관에 이를 고지하는 정도에 그쳤는데, 미국 정부가 이 문제의 본

www.aitimes.com