Elon Musk는 Twitter에서 가짜 메시지와 스팸을 계산하는 데 잘못된 접근 방식을 취합니다. 전문가

Elon Musk는 Twitter에서 가짜 메시지와 스팸을 계산하는 데 잘못된 접근 방식을 취합니다. 전문가

테슬라 CEO 일론 머스크가 보낸 트위터 그가 제안할 것이라고 말했을 때 주식은 금요일에 떨어졌다. 소셜 네트워크의 440억 달러 인수 “중단” 플랫폼에서 가짜 계정과 스팸의 비율을 조사하는 동안.

머스크는 나중에 자신이 여전히 거래에 전념하고 있음을 분명히했지만 가짜 계정 문제에 대해 계속 이야기했습니다. 그는 트위터에 자신의 팀이 자체 분석을 수행할 것이며 트위터가 최근 재무 보고에서 보고한 수치의 정확성에 대해 의구심을 표명했다고 썼습니다.

그 안에 올해 1분기 실적보고Twitter는 합법적인 일일 활성 사용 또는 사용자(mDAU)와 함께 플랫폼에 다수의 “가짜 또는 스팸 계정”이 있음을 인정했습니다. 회사는 “샘플 계정에 대한 내부 감사를 실시한 결과 2022년 1분기 평균 가짜 또는 스팸 계정이 해당 분기 MDAU의 5% 미만을 차지한 것으로 추정한다”고 밝혔다.

트위터 그는 또한 지난 3년 동안 사용자 수를 140만~190만 명이나 과장했다고 시인했다. 트위터는 “2019년 3월, 우리는 계정 간을 쉽게 전환할 수 있도록 사람들이 여러 개의 개별 계정을 함께 연결할 수 있는 기능을 출시했다”고 밝혔다. “당시 오류가 발생하여 기본 계정을 통해 취한 조치로 인해 연결된 모든 계정이 mDAU로 계산되었습니다.”

머스크가 호기심을 가질 만한 이유가 있을 수 있지만 소셜 미디어, 허위 정보 및 통계 분석 전문가들은 추가 분석에 대해 그가 제안한 접근 방식이 매우 부적절하다고 말합니다.

SpaceX는 다음과 같습니다. 테슬라 CEO는 트위터에 존재하는 스팸, 가짜 및 중복 계정의 수를 제한할 것이라고 말했습니다.

“답을 찾기 위해 우리 팀은 무작위로 100명의 트위터 팔로워를 샘플링할 것입니다. 저는 다른 사람들에게 같은 과정을 반복하고 그들이 발견한 것을 보도록 초대합니다.” 그는 후속 트윗에서 자신의 방법론을 설명하며 “팔로워가 많은 계정을 선택하십시오”, “처음 1,000명의 팔로워를 버리고 10명마다 선택합니다. 더 나은 아이디어에 열려 있습니다.”라고 덧붙였습니다.

Musk는 또한 증거를 제공하지 않고 자신의 연구를 위한 표본 크기 숫자로 100을 선택했다고 말했습니다. 왜냐하면 이것이 Twitter가 수익 보고서의 숫자를 계산하는 데 사용하는 숫자이기 때문입니다.

“합리적인 임의 샘플링은 괜찮습니다. 여러 사람이 독립적으로 가짜/가짜/중복 계정의 비율에서 비슷한 결과를 얻는다면 분명할 것입니다. 샘플 크기의 숫자로 100을 선택했습니다. Twitter가 계정에 사용하는 것이기 때문입니다. 5%는 가짜/스팸/중복입니다.”

트위터는 방법론에 대한 설명이 정확한지 묻는 질문에 논평을 거부했습니다.

페이스북 공동 설립자인 Dustin Moskovitz는 자신의 Twitter 계정을 통해 이 문제를 연구했으며 Musk의 접근 방식은 실제로 무작위가 아니며 매우 작은 샘플을 사용하며 대규모 오류의 여지를 남깁니다.

그는 “샘플을 그리는 데 도움이 되는 트위터 팀에 대한 신뢰 부족’도 일종의 위험 신호라고 생각합니다.”

봇센티넬 창립자이자 CEO인 Christopher Buzzi는 CNBC와의 인터뷰에서 자신의 회사 분석에 따르면 트위터 계정의 10~15%가 가짜, 스패머, 사기꾼, 사악한 봇을 포함하여 잠재적으로 “잘못된” 것으로 나타났습니다. -의도적으로 잘못된 정보를 퍼뜨리는 다른 사람들과 함께 일반적으로 개인을 표적으로 삼고 괴롭히는 목적의 “증오 계정”.

주로 크라우드 펀딩을 기반으로 하는 BotSentinel은 기계 학습 소프트웨어와 검토자 팀의 조합을 사용하여 Twitter에서 인증되지 않은 활동을 독립적으로 분석하고 식별합니다. 오늘날 이 회사는 250만 개 이상의 Twitter 계정을 모니터링하며 대부분이 영어를 사용합니다.

Bozzi는 “트위터가 ‘가짜 및 스팸’ 계정을 현실적으로 분류하지 않는다고 생각합니다.”라고 말했습니다.

그는 또한 토론 중인 주제에 따라 원본이 아닌 계정의 수가 트위터의 다른 구석에서 더 높거나 낮아질 수 있다고 경고합니다. 예를 들어, 고양이와 종이접기와 같은 논쟁의 여지가 없는 주제에 대해 토론하는 계정보다 정치, 암호화폐, 기후 변화 및 트윗에 대해 트윗하는 원본이 아닌 계정이 더 많다고 BotSentinel이 찾습니다.

“나는 머스크가 어리석은 샘플링 계획으로 우리를 조롱하는 것 외에 다른 일을 하고 있다는 것을 이해할 수 없습니다.”

칼 T 버그스트롬

저자, “불스 부르기—“

칼 T. Bergstrom, 워싱턴 대학교 교수 공동 저자 사람들이 데이터를 이해하는 데 도움이 되는 책 그는 온라인에서 허위 주장에 빠지는 것을 피하기 위해 CNBC에 한 트위터 계정의 100명의 팔로워를 샘플링하는 것이 440억 달러를 얻기 위한 “실사”에 해당해서는 안 된다고 말했습니다.

그는 100명의 표본 크기가 이런 종류의 연구를 연구하는 소셜 미디어 연구원에게 평소보다 10배 적은 것이라고 말했습니다. Musk가 이 접근 방식에서 직면하게 될 가장 큰 문제는 선택 편향으로 알려져 있습니다.

Bergstrom은 CNBC에 보낸 편지에서 “공식 Twitter 계정의 팔로워가 플랫폼의 대표적인 계정이라고 믿을 이유가 없습니다. 아마도 봇이 탐지를 피하기 위해 이 계정을 팔로우할 가능성이 낮을 것입니다. 나는 팔로우할 것입니다. 누가 알겠습니까? 하지만 머스크가 이 어리석은 샘플링 계획으로 우리를 조롱하는 것 외에 다른 일을 한다는 것을 이해할 수 없습니다.”

Beom Soojin

"음악 팬. 매우 겸손한 탐험가. 분석가. 여행 괴짜. 익스트림 TV 전문가. 게이머."

Learn More →

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다