GEO(생성형 엔진 최적화) : 논문으로 알아보기

AI가 답변을 생성하는 시대, 단순한 SEO만으로는 브랜드가 노출되지 않아요. 2024에 발표된 GEO 논문을 통해 생성형 엔진이 정보를 어떻게 인용하고, 콘텐츠 가시성을 어떻게 결정하는지 살펴봐요. 통계·인용·언어 구조 등 브랜드가 GEO 시대에 대비해야 할 전략을 정리했어요.
Gaia's avatar
Oct 27, 2025
GEO(생성형 엔진 최적화) : 논문으로 알아보기

최근 몇 년 사이, 검색의 방식이 근본적으로 달라지고 있어요.
우리가 익숙했던 ‘링크 클릭형’ 검색에서 벗어나, 이제는 ChatGPT, Perplexity처럼 AI가 직접 답을 만들어주는 생성형 검색이 중심이 되고 있죠.

이 변화는 사용자 입장에서는 더 빠르고 정확한 답을 주지만, 콘텐츠 제작자나 브랜드 입장에서는 ‘보이지 않게 되는’ 문제를 낳아요. 바로 이 지점을 다루는 첫 번째 공식 연구가 2024년에 학회에 발표된 〈GEO: Generative Engine Optimization〉이에요.
이 논문은 ‘생성형 엔진 최적화(GEO)’라는 새로운 패러다임을 공식 정의한 최초의 논문이에요.

1. 왜 GEO가 필요한가

논문은 이렇게 말해요. “Generative Engine은 사용자와 개발자에게는 편리하지만, 콘텐츠 제작자에게는 불리하다.”

기존 SEO(Search Engine Optimization)는 ‘검색 결과의 순위’를 높이는 게 목적이었어요. 하지만 생성형 엔진에서는 더 이상 ‘순위’라는 개념이 없어요. AI가 여러 웹페이지를 읽고 자신의 언어로 요약해버리기 때문이에요.

즉, 아무리 좋은 콘텐츠를 만들어도 AI의 요약에 인용되지 않으면, 존재조차 드러나지 않아요. 이 문제를 해결하기 위해 연구팀은 GEO (Generative Engine Optimization)을 제안했어요

GEO : AI가 만들어내는 답변 속에서, 내 콘텐츠가 얼마나 자주/어디에/어떻게 등장하는지를 최적화하는 것.

GEO 개념도   출처 : GEO 논문
GEO 개념도 출처 : GEO 논문

2. GEO의 핵심 개념

연구팀은 ‘Generative Engine’을 공식적으로 수식화했어요. 생성형 엔진은 크게 두 단계로 작동해요.

  1. 검색엔진이 관련 문서를 찾고

  2. LLM이 그 문서를 바탕으로 하나의 문장형 답변을 생성하죠.

이때 웹사이트가 노출되는 방식은 단순히 ‘1위 링크’가 아니라, 답변 속 인라인 인용 형태로 들어가요.
따라서 연구진은 새로운 ‘가시성’ 지표를 설계했어요:

  • Position-Adjusted Word Count (PAWC)
    → 내 콘텐츠가 인용된 문장의 길이와 위치를 합산해 계산 (높을수록 좋음)

  • Subjective Impression
    → 인용의 관련성, 영향력, 독창성, 클릭 가능성 등 7개 항목을 GPT 평가 모델로 점수화

이 두 가지 지표를 통해 연구팀은 “AI가 내 콘텐츠를 얼마나 ‘보이게’ 하고 있는가”를 수치화했어요.

Generative Engine 작동원리   출처:GEO 논문
Generative Engine 작동원리 출처:GEO 논문

3. GEO 방법론: 콘텐츠를 어떻게 바꿔야 할까?

논문에서는 9가지 GEO 전략을 제시했어요.

GEO 전략

내용

효과

Cite Sources

신뢰 가능한 출처를 명시

27% 향상

Quotation Addition

관련 인용문 추가

40% 향상

Statistics Addition

수치, 데이터 추가

30% 향상

Fluency Optimization

문장 유창성 개선

27% 향상

Easy-to-Understand

쉬운 언어로 단순화

16% 향상

Authoritative

단호하고 전문적인 어조로 수정

10% 향상

Technical Terms

도메인 관련 전문어 추가

17% 향상

Unique Words

반복 단어 제거, 어휘 다양화

6% 향상

Keyword Stuffing

키워드 삽입 (전통 SEO 방식)

−8% 감소

실험 결과, “인용문 추가(Quotation)”와 “통계 보강(Statistics)”이 가장 높은 가시성 향상 효과를 보였어요.
반대로 키워드 나열형 콘텐츠(전통 SEO 방식)는 오히려 LLM이 신뢰도를 낮게 판단했어요.

4. GEO-bench: 첫 공식 벤치마크

연구팀은 GEO 연구를 표준화하기 위해 ‘GEO-bench’라는 벤치마크도 만들었어요.
10,000개의 다양한 도메인 쿼리를 포함하며, 각 쿼리에 대해 구글 검색 상위 5개 웹소스를 함께 수집했어요.

이 GEO-bench를 통해 다양한 분야에서 GEO 전략의 효과를 실험적으로 비교할 수 있었어요.
결과적으로, 도메인별로 최적의 GEO 전략은 달랐어요:

  • Law & Government, Opinion 분야: 통계 추가가 가장 효과적

  • History, People & Society: 인용문 추가 효과 극대화

  • Science, Business: 유창성(Fluency) 향상이 눈에 띔

이건 곧 “GEO는 산업별, 언어별 커스터마이즈가 필요하다”는 중요한 시사점을 줘요.

5. 핵심 결과: 가시성 최대 40% 향상

논문은 GEO 방법을 적용해

  • 자체 시뮬레이션 엔진,

  • 실제 상용 엔진인 Perplexity.ai를 통해 두 환경에서 테스트했어요.

결과는 놀라웠어요.

  • GEO 적용 전 대비 평균 40%의 가시성 향상

  • 특히 검색 4~5위 웹사이트는 100% 이상 가시성 증가

즉, GEO는 기존 SEO보다 ‘순위 낮은 웹사이트를 살리는 기술’이에요.
검색 엔진의 상위권 독점을 깨고 콘텐츠 생태계를 민주화할 가능성을 보여줬어요.

6. 기업에게 주는 시사점

이 논문은 단순히 연구 차원을 넘어, AI 검색 환경에서의 브랜드 전략 전환점이에요.
기업 입장에서 GEO가 의미하는 것은 다음 세 가지예요.

  1. ‘AI가 어떻게 답을 생성하는가’를 이해해야 해요.
    이제 사용자는 ‘웹사이트’가 아니라 ‘답변’을 보고 판단해요.
    브랜드의 목표는 “LLM의 답변 안에 들어가는 것”이에요.

  2. 콘텐츠는 ‘인용 친화적’으로 바뀌어야 해요.
    수치·인용·출처·전문어처럼 LLM이 신뢰할 수 있는 구조를 만들어야 해요.
    즉, ‘LLM이 복사하고 싶은 콘텐츠’가 되어야 해요.

  3. SEO팀이 아닌 ‘GEO팀’이 필요해요.
    생성형 엔진별(Perplexity, Gemini, ChatGPT) 응답 데이터를 분석하고,
    답변 점유율을 모니터링하는 GEO KPI 체계가 필요해요.

7. 결론

〈GEO: Generative Engine Optimization〉은 단순히 SEO의 확장이 아니라, ‘AI가 세상을 어떻게 읽는가’에 대한 새로운 마케팅 과학이에요.

이제 기업이 묻는 질문은 “우리 브랜드가 구글 1위에 있나요?”가 아니라, “ChatGPT의 답변 속에 우리 브랜드가 들어 있나요?”로 바뀌어요.

GEO는 바로 그 질문에 답하는 기술이에요. 생성형 엔진의 시대, 가장 중요한 건 ‘보이는 링크’가 아니라 ‘인용되는 문장’이에요.

참조 | Aggarwal, P., Murahari, V., Rajpurohit, T., Kalyan, A., Narasimhan, K., Deshpande, A. (2023). GEO: Generative Engine Optimization. arXiv preprint arXiv:2311.09735.

Share article

바람 | 블로그