새로운 연구에 따르면 인공지능(AI)이 공식적으로 밈 튜링 테스트를 통과했다. 이제 대규모언어모델(LLM)이 평균적인 인간이 만든 밈보다 더 재미있는 밈을 생성한다고 한다.
무슨 일 있었나: 펜실베이니아대학교 와튼스쿨 교수인 에단 몰릭(Ethan Mollick)은 월요일(17일)에 소셜미디어 엑스(X)를 통해 “밈 튜링 테스트가 통과되었음을 발표하게 되어 유감스럽게 생각한다”는 글을 올렸다.
그는 “인간이 판단할 때 LLM은 평균적인 인간보다 더 재미있는 밈을 만들어낸다”며 “하지만 인간이 만든 최고의 밈은 여전히 AI를 이긴다”고 덧붙였다.
I regret to announce that the meme Turing Test has been passed.
LLMs produce funnier memes than the average human, as judged by humans. Humans working with AI get no boost (a finding that is coming up often in AI-creativity work) The best human memers still beat AI, however. pic.twitter.com/O0sl5GRQNd
— Ethan Mollick (@emollick) March 17, 2025
몰릭은 지쿤 우(Zhikun Wu), 토마스 웨버(Thomas Weber), 플로리안 뮐러(Florian Müller)가 저술한 “인간은 단순히 혼자서 밈하지 않는다: 유머 생성에 있어 LLM과 인간 간 공동 창의성 평가”라는 제목의 연구 논문을 참고 했다.
이 논문은 인간과 AI가 어떻게 협업하여 밈을 생성하는지를 탐구하여 인간 단독, 인간-AI 협업, AI 단독의 세 그룹으로 나누어 결과를 비교했다.
참가자들은 밈 템플릿과 일, 음식, 스포츠와 같은 사전 정의된 주제를 사용하여 시간 제한이 있는 아이디어 단계 동안 캡션을 생성했다. 그런 다음 유머, 창의성, 공유 가능성 등을 기준으로 다른 그룹의 밈과 비교하여 GPT-4가 만든 AI 생성형 밈을 평가했다.
최신 기술 개발 소식을 놓치지 않으려면 BENZINGA 테크 트렌드 뉴스레터를 구독하세요.
그 결과, 모든 카테고리에서 AI만 사용한 밈이 인간만 사용한 밈보다 일관되게 높은 평가를 받은 것으로 나타났다. 인간과 AI의 협업은 더 많은 아이디어를 만들어냈지만, 그 품질은 크게 향상되지 않았다.
하지만 인간이 만든 최고의 밈은 여전히 유머 부문에서 AI보다 뛰어났다.
왜 중요한가: 이번 연구 결과는 특히 밈과 같은 문화 및 유머 중심 콘텐츠에서 인간 창의성의 특정 측면을 모방하고 심지어 능가하는 AI의 능력이 점점 더 커지고 있음을 강조한다.
AI는 생산성을 높이고 창의적인 작업량을 줄여주지만, 인간이 AI와 협업할 때 품질이 언제나 향상되는 것은 아니다.
이미지 출처: Shutterstock
면책 조항: 이 콘텐츠는 부분적으로 AI 도구의 도움을 받아 생성되었으며, Benzinga 편집자가 검토하고 게시했습니다.
다른 트레이더들보다 30분 일찍 시장 움직임에 대한 독점 뉴스를 받아보세요.
Benzinga Pro의 독점 뉴스를 통해 수백만 명의 다른 트레이더보다 더 빠르게 유용한 투자 뉴스를 확인할 수 있습니다. 여기를 클릭하여 14일 무료 체험을 시작하세요.