ChatGPT 및 AI 표절 탐지 방법

게시 됨: 2023-06-22

ChatGPT는 몇 초 만에 지구상의 거의 모든 주제에 대해 일관되고 잘 작성된 사본을 생성하는 기능으로 학계 및 비즈니스 세계를 뒤집어 놓았습니다.

그것의 놀라운 능력은 모든 교육 수준의 학생들이 Bard 와 같은 라이벌뿐만 아니라 챗봇을 사용하여 완료하는 데 몇 시간이 걸리는 복잡한 에세이를 작성하는 것을 보았습니다.

이것은 종종 "ChatGPT 표절"이라고 불리는 새로운 현상에 대한 세계적인 대화를 시작했습니다. 이 가이드는 기업 및 교육 기관에서 ChatGPT 표절, ChatGPT 부정 행위의 위험성, ChatGPT 사용이 표절로 간주되는지 여부를 감지하기 위해 사용하는 도구를 다룹니다.

  • ChatGPT 표절을 감지하는 방법
  • 가장 인기 있는 AI 및 ChatGPT 표절 검사기
  • AI 콘텐츠 검사기는 실제로 작동합니까?
  • ChatGPT 또는 Bard를 사용하는 것이 실제로 표절입니까?
  • ChatGPT로 부정 행위의 위험
  • ChatGPT는 표절합니까?
  • 음유 시인은 표절합니까?
  • 다른 AI 도구는 표절합니까?
  • 내 에세이 또는 작업에 ChatGPT를 사용해야 합니까?

ChatGPT 표절을 감지하는 방법

ChatGPT 표절을 감지하려면 AI 콘텐츠 검사기가 필요합니다. AI 콘텐츠 검사기는 텍스트 본문을 스캔하여 ChatGPT 또는 Bard와 같은 챗봇이 생성했는지 아니면 사람이 생성했는지 확인합니다. 그러나 나중에 다루겠지만 이러한 도구는 신뢰할 수 있는 것과는 거리가 멉니다.

코드와 관련하여 표절을 감지하는 것이 약간 더 어렵습니다. ChatGPT도 가능하게 생성할 수 있습니다. 코드에 대한 AI 감지 도구의 에코시스템은 콘텐츠용과 완전히 동일하지 않습니다.

그러나 예를 들어 대학 환경에 있고 기술 수준을 훨씬 넘어서는 코드를 제출하는 경우 교수나 강사는 귀하가 ChatGPT에 도움을 요청했다고 매우 합당한 의심을 가질 수 있습니다.

가장 인기있는 AI 및 ChatGPT 표절 검사 도구 검토

2022년 11월 ChatGPT가 출시된 이후 많은 기업과 교육 기관에서 인공적으로 생성된 콘텐츠와 사람이 만든 콘텐츠를 구별할 수 있다고 주장하는 AI 콘텐츠 검사기를 제작했습니다. 이제 많은 회사에서 다른 언어 모델을 사용하는 Google의 챗봇 Bard도 사용하고 있습니다.

그러나 가장 평판이 좋은 AI 콘텐츠 탐지 도구의 정확성에 대해서도 치열한 논쟁이 벌어지고 있으며 AI 콘텐츠와 교육을 사용한 것으로 잘못 고발된 학생들 사이의 법정 소송이 이미 구체화되었습니다.

결론은 이것입니다. 이 공간에서 100% 정확한 도구는 없지만 일부는 다른 것보다 훨씬 낫습니다.

지피티제로

GPTZero는 인기 있는 무료 AI 콘텐츠 탐지 도구로 "여러 독립적인 소스에서 검증된 사용 사례에서 가장 정확한 AI 탐지기"라고 주장합니다.

그러나 지난 4월, UC Davis의 한 역사 학생은 교수가 사용하는 AI 콘텐츠 탐지 도구인 GPTZero가 자신의 에세이를 AI 생성으로 표시했을 때 틀렸다는 것을 증명했습니다.

ChatGPT에게 짧은 이야기를 써달라고 요청하여 GPTZero를 테스트했습니다. 불행히도 GPTZero는 콘텐츠가 AI 도구로 작성되었음을 알 수 없었습니다.

GPTZero 표절 테스트

독창성.ai

Originality.ai는 확실히 현재 사용 가능한 보다 정확한 AI 콘텐츠 감지 도구 중 하나입니다.

이 회사는 올해 4월 AI 콘텐츠 탐지 도구에 대한 자체 연구를 수행했으며, 그 안에서 인공적으로 생성된 600개의 텍스트 블록과 사람이 생성한 600개의 텍스트 블록을 자체 콘텐츠 탐지 시스템에 공급했습니다. .

아래 결과에서 볼 수 있듯이 Originality.ai는 테스트에 포함된 모든 도구를 능가했습니다.

독창성 AI 표절 테스트

Originality.ai의 유일한 단점은 무료 플랜이 없으며 이 기사에 포함된 다른 앱과 마찬가지로 무료로 테스트할 수도 없다는 것입니다. 2,000크레딧에 20달러이며 200,000단어를 확인할 수 있습니다.

Copyleaks AI 콘텐츠 탐지기

Copyleaks는 99.12%의 정확도로 사람이 생성한 사본과 AI가 생성한 사본을 구별할 수 있다고 주장하는 무료 AI 콘텐츠 탐지기입니다.

Copyleaks는 또한 문서나 구절의 다른 부분이 사람이 작성한 것처럼 보이더라도 문서나 구절의 특정 측면이 AI에 의해 작성되었는지 여부를 알려줍니다.

Copyleaks는 "ChatGPT, GPT-4, GPT-3, Jasper 등"에 의해 생성된 AI 생성 콘텐츠를 감지할 수 있으며 "최신 모델이 출시되면 자동으로 감지할 수 있을 것"이라고 주장합니다.

CopyLeaks 비용은 1,200크레딧(크레딧당 250단어)에 대해 월 $8.33입니다.

그러나 2023년 2월 TechCrunch가 실시한 테스트에서 Copyleaks는 뉴스 기사, 백과사전 항목, 커버 레터를 포함하여 다양한 유형의 AI 생성 카피를 인간이 생성한 것으로 잘못 분류했습니다.

또한 위에서 언급한 Originality.ai의 연구에서는 14.50%의 사례에서만 정확하다는 사실을 발견했습니다. 이는 CopyLeaks가 주장하는 99.12%의 정확도 주장과는 거리가 멉니다.

그러나 우리가 테스트했을 때 우리가 입력한 텍스트가 ChatGPT에 의해 생성된 것임을 알아낼 수 있는 것 같았습니다.

카피리크스 AI 탐지기

Turnitin AI 감지기

Turnitin은 학생들의 작업을 스캔하기 위해 다양한 대학에서 배포하는 미국 기반의 표절 탐지 회사입니다. Turnitin은 모든 종류의 표절을 감지하도록 설계되었지만 지난 4월에 AI 중심 팀에 한동안 투자해 왔다고 밝혔습니다.

Turnitin은 "우리의 통제된 실험실 환경에서 98%의 신뢰도와 1% 미만의 오탐률로 AI 쓰기의 존재를 감지할 수 있다"고 말합니다.

그러나 회사는 콘텐츠의 일부를 AI 생성으로 플래그 지정하는 콘텐츠는 "고발이 아닌 표시"로 취급되어야 한다고 말합니다. Turnitin의 AI 탐지기의 진정한 정확도는 Washington Post와 다른 출처에서 논쟁을 벌였습니다.

Turnitin의 AI 콘텐츠 감지 소프트웨어는 현재 무료이지만 회사는 웹 사이트의 FAQ에서 2024년 1월에 유료 라이선스 프로그램으로 전환할 것이라고 밝혔으며 가격은 명시되지 않았습니다.

OpenAI 텍스트 분류기

제3자 AI 콘텐츠 검사기에 의해 능가되지 않으려는 OpenAI는 콘텐츠가 AI에 의해 생성되었는지 여부를 분류하도록 설계된 소프트웨어를 자체적으로 출시했습니다.

입력하는 문서 또는 텍스트의 길이는 1000자 이상이어야 합니다. 문서를 입력하면 OpenAI는 문서가 인간에 의해 생성되었다고 생각하는 가능성을 거의 즉시 알려줍니다.

저는 작가가 작성한 최근 Tech.co 기사에서 발췌한 내용을 게시했습니다. OpenAI는 AI가 작성했을 가능성이 "매우 낮다"고 정당하게 판단했습니다.

이전에 참조한 동일한 TechCrunch 기사에서 출판물에 따르면 OpenAI는 텍스트 분류기가 AI 생성 콘텐츠의 74%를 놓친다고 추정합니다. 그들이 이것에 대해 너무 정직한 것도 좋은 일입니다. ChatGPT에서 생성된 짧은 이야기를 사용하여 두 번째 테스트를 수행했을 때 AI가 생성했다는 사실을 인식하지 못했습니다.

OpenAI 텍스트 분류기 테스트

AI 콘텐츠 감지가 실제로 작동합니까?

어떤 AI 콘텐츠 감지 도구도 100% 신뢰할 수는 없습니다. 우리의 테스트는 이를 상당히 확실하게 입증했습니다.

그러나 오늘 논의한 도구 중 실제로 100% 정확하다고 주장하는 도구는 없으며 오 탐지가 전혀 없다고 주장하는 도구는 거의 없습니다. GPTZero와 같은 다른 사람들은 결과를 복음으로 받아들이는 것에 대한 면책 ​​조항을 게시합니다.

인공 지능을 사용하여 에세이를 작성했다는 혐의로 기소된 많은 대학생들은 이미 자신의 작업이 원본임을 증명해야 했습니다.

텍사스에서는 지난 3월 한 교수가 학생들이 에세이 작성에 ChatGPT를 사용했다고 부당하게 고발한 후 전체 학급 학생들을 낙제시켰습니다. 또한 Originality.ai에서 수행한 것과 같은 연구와 보고서 모음이 있는데, 가장 유능한 표절 검사자조차도 그들이 주장하는 것만큼 정확하지 않다는 것을 시사합니다.

Turnitin의 AI 콘텐츠 감지기조차 완벽한 것은 아닙니다. 앞서 논의한 워싱턴 포스트가 최근 실시한 비교적 작은 테스트에서 정확도는 그들이 생산할 수 있다고 주장하는 98%에 훨씬 못 미쳤습니다.

반면에 Originality.ai는 확실히 사용 가능한 더 강력한 것 중 하나이며 탐지 기술도 매번 올바르지 않습니다.

게다가 어떤 면에서든 잘못된 긍정이 존재한다면 학생들이 자신의 작업이 독창적이고 단순히 잘못 식별되었다고 주장할 여지가 항상 있을 것입니다.

ChatGPT 또는 Bard 표절을 사용하고 있습니까?

ChatGPT가 실제로 표절인지 여부는 논쟁의 여지가 있습니다. Oxford Languages는 표절을 "다른 사람의 작업이나 아이디어를 가져와 자신의 것처럼 전달하는 행위"로 정의합니다.

ChatGPT는 사람이 아니며 단순히 답변을 생성할 때 다른 사람의 작업과 아이디어를 재현하는 것이 아닙니다. 따라서 사전적 정의에 따르면 명백한 표절은 아니다.

그렇게 하고 있더라도 그것이 어디에서 왔는지(예: ChatGPT) 정직하다면 어쨌든 표절이 아닐 것입니다.

그러나 일부 학교와 대학에서는 광범위한 표절 규칙을 가지고 있으며 챗봇을 사용하여 에세이를 작성하는 것을 고려합니다. Furman University의 한 학생은 ChatGPT를 사용하여 에세이를 작성한 후 12월에 철학 학위를 취득하지 못했습니다. 또 다른 사례로는 Northern Michigan University의 한 교수가 수업에 에세이를 쓰기 위해 챗봇을 사용하는 두 명의 학생을 붙잡았다고 보고했습니다.

ChatGPT를 사용하여 에세이를 생성한 다음 이것을 자신의 작업으로 전달하는 것은 아마도 "속임수"로 더 잘 설명되며 확실히 "부정직"합니다.

에세이 작성의 요점은 당신이 독창적인 생각을 하고, 관련 개념을 이해하고, 상충되는 주장을 신중하게 고려하고, 정보를 명확하게 제시하고, 출처를 인용할 수 있음을 보여주는 것입니다.

이러한 방식으로 ChatGPT를 사용하는 것과 다른 학생에게 비용을 지불하고 에세이를 작성하는 것에는 거의 차이가 없습니다. 물론 이는 부정 행위입니다.

Google의 Bard와 관련하여 대답은 조금 더 복잡합니다. 위에서 사용된 동일한 논리 라인이 ChatGPT와 마찬가지로 Bard에도 적용되지만 Bard는 표절 혐의와 ChatGPT가 아닌 방식으로 인터넷에서 가져온 내용을 잘못 인용하여 손상되었습니다. 따라서 Bard를 사용하면 실수로 다른 소스를 표절할 수 있습니다( 자세한 내용은 아래 참조 ).

ChatGPT로 부정 행위의 위험

Elon University의 겸임 조교수인 Christopher Howell은 최근 학생들에게 중요한 과제에 ChatGPT를 사용한 다음 생성된 에세이를 채점하도록 요청했습니다.

그는 긴 Twitter 스레드(첫 번째 부분은 아래 그림 참조)에서 참여한 63명의 모든 학생이 과제에서 가짜 인용문, 가짜 및 잘못 해석된 출처를 포함하여 어떤 형태의 "환각"을 발견했다고 보고했습니다.

chatgpt 실수에 대해 이야기하는 교수

ChatGPT는 응답에서 표절합니까?

아니오 – ChatGPT는 다른 소스에서 정보를 가져오지 않고 단순히 문장 단위로 함께 섞습니다. 이것은 Generative Pre-trained Transformers의 작동 방식에 대한 오해입니다.

ChatGPT(더 정확하게는 GPT 언어 모델)는 방대한 양의 문서, 웹사이트 자료 및 기타 텍스트 데이터 세트에 대해 학습됩니다.

알고리즘을 사용하여 데이터 세트 내에서 언어 시퀀스와 패턴을 찾습니다. 그런 다음 언어 모델이 이러한 데이터 세트의 시퀀스에서 언어에 대해 학습한 내용을 기반으로 단락, 문장 및 단어를 생성할 수 있습니다.

그렇기 때문에 두 개의 서로 다른 장치에서 동시에 동일한 질문을 ChatGPT에 요청하면 일반적으로 답변이 매우 유사하지만 여전히 변형이 있으며 때로는 완전히 다른 답변을 제공합니다.

음유 시인은 응답에서 표절합니까?

ChatGPT의 가장 큰 라이벌인 Google의 Bard는 출시 이후 더 인기 있는 상대보다 콘텐츠 표절 문제가 훨씬 더 많았습니다. 기술 웹사이트인 Tom's Hardware는 Bard가 자사 기사 중 하나를 표절했다는 사실을 발견하고 직원 중 한 명이 이를 지적하자 사과했습니다.

더 최근인 2023년 5월, PlagiarismCheck는 Yahoo News에 Bard로 35개의 텍스트를 생성했으며 그 중 25개에서 이미 인터넷에 게시된 기존 콘텐츠를 간단히 의역하여 5% 이상 표절된 것을 발견했다고 밝혔습니다.

아마도 이것을 설명할 수 있는 Bard와 ChatGPT의 한 가지 큰 차이점은 Bard가 인터넷에서 응답을 검색할 수 있다는 것입니다. 이것이 ChatGPT가 어려움을 겪고 있는 2021년 이후 이벤트와 관련된 질문을 더 잘 처리하는 경향이 있는 이유입니다. 그러나 이것은 덜 독창적인 방식으로 소스에서 데이터를 가져오고 소스를 더 자주 인용한다는 의미이기도 합니다.

이러한 예는 일시적일 수 있지만 중요한 작업에 Bard를 사용하는 경우 위험을 아는 것이 좋습니다.

다른 AI 도구는 표절합니까?

불행히도 그렇습니다. 일부 회사는 콘텐츠를 표절한 AI 도구를 사용하여 이미 당황했습니다. 예를 들어, 세계에서 가장 큰 기술 사이트 중 하나인 CNET은 AI 도구를 사용하여 기사를 생성하는 것으로 밝혀졌으며 이에 대해 전혀 투명하지 않았습니다. CNET이 AI를 사용하여 게시한 기사의 약 절반은 잘못된 정보가 포함된 것으로 나타났습니다.

설상가상으로 CNET의 AI 표절에 대한 조사를 시작한 Futurism은 "봇의 오작동은 원본을 제대로 밝히지 않은 채 그대로 복사하는 것부터 중간 정도의 편집, 중요한 문구 변경에 이르기까지 다양합니다"라고 말했습니다.

예술이든 텍스트든 독특하고 독창적인 콘텐츠를 생성하지 않는 AI 도구는 이미 인터넷에 게시된 콘텐츠를 표절할 가능성이 있습니다. AI 도구가 사용하는 언어 모델이 어떻게 작동하는지 정확히 이해하고 생산하는 콘텐츠를 철저히 감독하는 것이 중요합니다. 그렇지 않으면 CNET과 같은 위치에 놓일 수 있습니다.

에세이 또는 작업에 ChatGPT를 사용해야 합니까?

에세이에 ChatGPT 사용

ChatGPT가 단순히 다른 출처에서 답변을 가져오고 문장을 뭉치지 않는다는 사실은 기업이 저작권 문제에 대한 걱정 없이 ChatGPT를 다양한 작업에 사용할 수 있음을 의미합니다.

그러나 그것의 내부 역학은 종종 환각을 일으키고 실수를 한다는 것을 의미하기도 합니다. 완벽함과는 거리가 멀고, ChatGPT가 대학교를 위한 에세이를 작성하도록 유혹하고 있지만 권장하지 않습니다.

물론 모든 교육 기관의 구체적인 제출 지침은 약간 다를 수 있지만 귀하의 대학이나 학교에서 이미 "부정 행위" 또는 표절로 간주될 가능성이 매우 큽니다. 또한 정확도에 관계없이 교육 기관은 시간이 지남에 따라 개선될 AI 콘텐츠 탐지기를 사용하고 있습니다.

직장에서 ChatGPT 사용하기

물론 많은 사람들이 직장에서 이미 ChatGPT를 사용하고 있습니다 . ChatGPT는 다양한 산업 분야에서 유용한 것으로 입증되고 있으며 모든 종류의 역할을 맡은 작업자가 일상 업무에서 귀중한 시간을 절약할 수 있도록 도와줍니다.

그러나 직장에서 ChatGPT를 사용하는 경우, 특히 외부 이해관계자를 위한 보고서 작성과 같은 중요한 활동에 ChatGPT를 사용하는 경우 관리자 또는 감독자에게 공개하는 것이 좋습니다.

또한 ChatGPT, Bard 또는 기타 AI 도구를 사용하여 생성하는 모든 작업을 철저히 편집하고 면밀히 검토하는 것이 좋습니다. 이러한 채팅이 저장되는 위치나 OpenAI의 보안 인프라에 대한 공개 정보가 많지 않기 때문에 민감한 개인 또는 회사 정보를 챗봇에 넣는 것은 현명하지 않습니다.

에세이 또는 작업에 다른 AI 도구 사용

물론 Bard와 ChatGPT만이 AI 챗봇이 아닙니다. 그러나 우리는 강력한 언어 모델이 지원하지 않는 더 작은 AI 도구에 대한 지원을 주저할 것입니다. 그것들은 자원이 충분하지 않을 것이며 업무용으로 실험을 해보면 유용하지 않을 것입니다.

그러나 동일한 규칙이 여전히 적용됩니다. 관리자에게 공개하고 사용에 대한 승인을 받고, 민감한 회사 데이터를 입력하지 말고, 주어진 답변을 항상 검토하십시오.