AI가 만든 ‘가짜 참고문헌’ 폭증…생의학 논문 250만편 분석 충격 결과

AI 확산으로 허위 인용 문제가 빠르게 증가해 논란이 되고 있다. [사진: 셔터스톡]

[디지털투데이 AI리포터] 생의학 논문 약 250만 편을 분석한 결과, 2810편에서 존재하지 않는 참고문헌 4046건이 확인된 것으로 나타났다.

26일(이하 현지시간) 온라인 매체 기가진에 따르면, 미국 컬럼비아대 간호대학과 데이터사이언스연구소의 맥심 토파즈 부교수 연구팀은 2023년 1월 1일부터 2026년 2월 18일까지 생의학 분야 무료 논문 아카이브인 펍메드 센트럴(PubMed Central, PMC)에 색인된 약 250만 편의 논문과 약 9700만 건의 인용 문헌을 인공지능(AI) 기반 자동 검증 시스템으로 분석했다.

분석 결과 허위 참고문헌 수는 2023년부터 2026년까지 12배 이상 증가한 것으로 나타났다. 특히 AI 도구 사용이 확산된 직후인 2024년에 증가세가 두드러졌다. 논문 1만 편당 허위 참고문헌 수는 2023년부터 2024년 중반까지 4건 미만 수준이었지만, 2024년 중반 이후 급증해 2026년 1월에는 57건에 달했다.

비율 기준으로는 2023년 2828편당 1건 수준에서 2025년 458편당 1건으로 증가했고, 2026년 첫 7주에는 277편당 1건까지 늘어났다. 다만 연구팀은 모든 허위 참고문헌이 AI 생성 결과라고 단정할 수는 없다고 밝혔다. 맥심 토파즈 부교수 역시 논문 교정 과정에서 AI 도구를 사용했다가 학술지로부터 가공된 참고문헌이 포함됐다는 지적을 받은 사례가 있는 것으로 알려졌다.

문제는 이러한 오류가 후속 연구와 임상 지침으로까지 확산될 수 있다는 점이다. 의학 연구는 선행 연구 인용, 임상시험, 체계적 문헌 고찰, 의료 가이드라인으로 이어지는 구조를 가지기 때문에 초기 단계의 오류가 이후 과정에 연쇄적으로 반영될 가능성이 있다. 연구팀이 확인한 한 논문에서는 참고문헌 30건 중 18건이 허위 문헌이었으며, 일부는 다른 논문과 체계적 문헌고찰에도 이미 인용된 상태였다.

학술 출판계의 대응은 상대적으로 더딘 상황이다. 허위 참고문헌이 포함된 것으로 확인된 논문 중 98.4%는 철회되지 않았다. 연구팀은 출판사에 참고문헌 검증 강화를 권고했으며, 색인 서비스에는 참고문헌 정확성을 평가할 수 있는 메타데이터 도입을 제안했다. 또한 주요 연구윤리 데이터베이스가 허위 참고문헌을 체계적으로 추적할 필요가 있다고 강조했다.

AI가 생성한 허위 인용 문제는 학술계 외부에서도 확인되고 있다. 법률 문서에는 존재하지 않는 판례가 포함된 사례가 다수 보고됐다. 2026년 스티븐 로젠바움(Steven Rosenbaum)의 저서 '진실의 미래: AI가 현실을 어떻게 재구성하는가'(The Future of Truth: How AI Reshapes Reality)에서도 AI가 생성한 부정확한 인용이 다수 포함된 것으로 지적됐다. 또한 폴란드 작가 올가 토카르추크(Olga Tokarczuk)는 집필 과정에서 AI를 사용했다고 공개한 이후 논란이 제기된 바 있다.