[AI 생성 콘텐츠 식별법] *본 기사는 다음의 링크를 번역한 것으로,

[AI 생성 콘텐츠 식별법]

*본 기사는 다음의 링크를 번역한 것으로, AI를 거치지 않은 인간지식임을 인증합니다. https://emeritus.org/in/learn/how-to-identify-ai-generated-content/

자연어 생성(NLG, Natural Language Generation) 알고리즘은 인간의 언어와 유사한 글을 생성할 수 있는 잠재력을 지니며, 적대적 생성 신경망(GAN, Generative Adversarial Networks)은 인상적인 시각 예술과 영상을 만들어낼 수 있습니다. 그러나 다음과 같은 방법으로 AI가 생성한 콘텐츠를 식별하는 것은 여전히 가능합니다.

AI가 생성한 콘텐츠는 보통 일정한 패턴을 따르거나 동일한 문구를 반복적으로 사용하는 경향이 있습니다. 예를 들어, ChatGPT가 “변혁적 리더십의 장점”에 대해 답변할 때 “변혁적 리더(Transformational leaders)”라는 표현을 여러 번 반복하는 경우가 있습니다.

2. AI 탐지 도구 활용

Copyleaks, GPTZero 같은 도구를 사용하면 인간이 쓴 글과 AI가 쓴 글을 구별할 수 있습니다. 이러한 도구들은 “AI가 생성한 콘텐츠를 식별하는 방법”에 대한 대표적인 해답이 됩니다.

3. 출처(인용) 확인

특히 연구나 학술 논문에서는 인용을 점검하는 것이 AI 생성 콘텐츠를 식별하는 유용한 방법입니다. AI 도구들은 종종 잘못된 혹은 무작위의 인용 정보를 제공합니다.

인간 작가들은 목표, 대상 독자, 그리고 원하는 어조에 맞춰 맥락 있는 콘텐츠를 작성합니다.

반면 AI가 생성한 콘텐츠는 일반적이며, 특정 독자층에 초점을 맞추지 않습니다. 예를 들어 아래의 ChatGPT 답변은 “재정적 역량 개발 방법”에 집중하기보다 예산 관리, 부채 관리, 신용 점검, 절약 습관 등 다양한 재정 주제를 혼합하여 다룹니다.

AI가 생성한 텍스트의 주요 특징은 무엇일까?

AI 모델이 점점 더 정교해지면서 인간이 쓴 글과 AI가 쓴 글을 구분하기가 어려워지고 있습니다. 하지만 다음의 핵심 지표를 통해 AI 생성 텍스트를 감지할 수 있습니다.

1. 특이점이 없는 평이한 문장 구성

AI 글쓰기 도구는 주로 온라인 정보를 수집해 이를 재구성(paraphrasing)하여 일관되고 예측 가능한 문장을 만듭니다. 반면 인간의 글은 다양한 스타일, 어조, 표현을 사용해 독자의 흥미를 유발합니다.

2. 일반적이고 평범한 정보

AI가 만든 텍스트는 인터넷에서 쉽게 찾을 수 있는 일반적인 정보로 구성되어 있습니다. 반면 인간의 글은 주장을 뒷받침하기 위한 통계, 사실, 통찰 등을 포함합니다.

3. 지나치게 완벽한 문법

오탈자나 문법적 실수가 전혀 없는 글이라면 AI가 작성했을 가능성이 높습니다. 또한 지나치게 복잡한 어휘나 과도한 전문 용어 사용도 AI의 특징 중 하나입니다.

4. 반복되는 내용

AI 도구들은 종종 불필요하거나 반복적인 정보를 제공하기 때문에, 이러한 반복 패턴으로 AI 생성 텍스트를 감지할 수 있습니다.

AI가 쓴 글을 탐지할 수 있는 도구나 기법이 있을까?

있습니다. 다음은 널리 사용되는 대표적인 AI 탐지 도구들입니다.

AI가 생성한 콘텐츠와 인간이 쓴 콘텐츠의 차이점

사람은 이야기(story)에 끌립니다. 청중은 블로그, 예술, 리더십 글 등에서 창작자의 경험과 감정에 공감하며 연결됩니다.

하지만 생성형 AI는 인간의 감정이 담기지 않은 인공적인 이야기나 인용을 만들어냅니다.

또한 학술적인 관점에서 보면, AI가 생성한 콘텐츠는 인간이 쓴 콘텐츠보다 덜 복잡합니다. AI는 문단당 문장 수가 적고, 문장이 짧습니다. 인간은 물음표, 콜론(:), 세미콜론(;) 등을 자주 사용하는 반면, AI는 주로 작은따옴표(’)만 사용하는 경향이 있습니다.

AI 생성 예술(Art)을 식별하는 방법

연구에 따르면 AI는 전통 예술 기법을 대체할 가능성이 있으며, 이는 인간 예술가의 가치 저하로 이어질 수 있습니다. 따라서 전문가들은 AI가 생성한 이미지와 예술작품을 식별하는 법을 배워야 합니다.

1. 텍스처(질감)의 부자연스러움

AI 이미지의 배경은 지나치게 거칠거나, 반대로 지나치게 매끄럽습니다. 배경의 흐릿한 물체나 픽셀화된 반사로 이를 식별할 수 있습니다.

2. 에어브러시 효과

AI 생성 이미지는 부드럽거나 흐릿해 보이며, 무작위 붓자국이 섞여 있습니다.

예를 들어, 국제앰네스티(Amnesty International)는 2021년 콜롬비아 시위를 표현하기 위해 AI 이미지를 사용했는데, 부드럽게 처리된 얼굴과 흐릿한 깃발이 AI 생성의 흔적이었습니다.

(출처: The Guardian)

3. 왜곡된 인체 특징

특히 손, 미소, 시선 방향 등 인체의 세부 표현이 부자연스럽거나 왜곡되어 있으면 AI 이미지일 가능성이 높습니다.

4. 워터마크(출처 표시)

많은 AI 이미지 생성 도구들은 이미지에 작은 로고나 텍스트 형태의 워터마크를 추가합니다.

Google, OpenAI 등 주요 AI 기업들도 AI 생성 이미지를 식별하기 위해 워터마크 삽입을 공식적으로 약속했습니다.

AI는 기존 데이터나 알고리즘에 기반해 예술을 생성하기 때문에, 인간 예술처럼 창의적 영감이나 감정적 깊이를 담지 못합니다. 대부분의 AI 이미지가 유사한 색감, 패턴, 질감을 보이는 이유입니다.

AI 생성 콘텐츠 식별에 관한 자주 묻는 질문

1. AI가 생성한 콘텐츠임을 확실히 파악할 수 있는 결정적인 단서가 있을까요?

위에 적어둔 기준들을 가지고 살피면 식별은 가능하지만, 갈수록 쉽지 않습니다. 하지만 물론 Copyleaks나 AI Text Classifier 같은 도구는 90% 이상 정확하게 AI 생성 콘텐츠를 식별할 수 있습니다. 반복되는 단어, 기계적인 문체 등도 중요한 단서입니다.

2. AI가 생성한 이미지를 탐지할 수 있나요?

가능합니다. AI 이미지 탐지기 사용, 워터마크 확인, 이미지 역검색(Reverse Image Search) 등이 유효한 방법입니다.

3. 누군가의 예술 작품이 AI로 만든 것인지 어떻게 알 수 있나요?

비현실적인 풍경, 왜곡된 인체 묘사, 비정상적으로 높은 해상도, 인간이 재현하기 어려운 세밀한 묘사 등이 단서가 됩니다.

4. Google은 워터마크를 통해 AI 이미지를 감지하나요?

2023년 8월, Google은 텍스트-이미지 모델 Imagen을 위한 워터마크 추가 도구 SynthID의 베타 버전을 출시했습니다.

5. AI 생성 이미지를 탐지하는 도구는?

Optic AI or Not, Hugging Face, Fake Image Detector 같은 도구를 사용할 수 있습니다.

6. Google은 AI 콘텐츠를 식별할 수 있나요?

네. Google은 AI가 생성한 콘텐츠라도 품질이 높다면 순위에 반영합니다. 하지만 스팸 정책을 위반하는 AI 콘텐츠는 제거합니다.

Google은 BERT(양방향 인코더 표현), 중복 제거, 정확 일치 도메인(Exact Match Domains) 등의 시스템을 사용해 관련성을 평가합니다.

생성형 적대 신경망(GAN)은 생성 모델과 판별 모델로 구성되어 있습니다.

생성 모델은 학습 데이터에 기반해 콘텐츠를 만들고, 판별 모델은 결과를 데이터베이스와 비교하여 AI가 만든 것일 확률을 평가합니다.

이러한 구조 덕분에 AI의 결과물은 점점 정교해지고, 인간의 텍스트와 구분하기 어려워지고 있습니다.

역주(모임장): 세상 무섭네요. 거짓정보가 판치는 세상에서 AI로 생성된 컨텐츠의 식별능력은 더더욱 중요해질 것 같습니다. 놓치지 말고 계속 추이를 지켜보아야 하겠습니다!