Klasik arama motoru mantığı şuydu:

“Bu kelime sayfada kaç kere geçiyor?”

Vector retrieval ise şunu soruyor:

“Bu içerik gerçekten ne anlatıyor?”

Aradaki fark devasa.

Generative Engine Optimization ile Discoverability Artırma

Çünkü artık sistemler kelimeyi değil, anlamı arıyor.

Bugünkü:

ChatGPT
Perplexity
Gemini
Claude
AI Overviews
Copilot
You.com

gibi sistemlerin neredeyse tamamı bilgi erişiminde vector retrieval mantığı kullanıyor.

Ve bu, SEO’nun bildiğimiz halini bitiriyor.

Önce Temel Mantık

Bir AI sistemi senin yazını düz metin olarak görmez.

Metni:

sayılara,
matematiksel koordinatlara,
çok boyutlu vektörlere

çevirir.

Buna:

Embedding

denir.

Örneğin:

“SEO uzmanı” ve “arama motoru danışmanı”

kelime olarak farklıdır.

Ama anlam olarak yakın oldukları için vector space içinde birbirine yakın konumlanırlar.

Yani AI şunu anlayabilir:

“Kelime aynı değil ama intent aynı.”

İşte modern SEO’nun kırıldığı nokta bu.

Embedding’in Boyutu Meselesi

Bir embedding aslında nedir?

Bir sayı dizisi.

Ama sıradan değil.

Yüzlerce, bazen binlerce boyutlu.

Örneğin:

OpenAI text-embedding-3-small → 1536 boyut
OpenAI text-embedding-3-large → 3072 boyut
Cohere embed-v3 → 1024 boyut
Google Gemini embedding → 768 boyut

Her boyut, anlamın bir parçasını temsil eder.

Bir boyut “teknik mi günlük mi” olduğunu, bir başkası “olumlu mu olumsuz mu” olduğunu, bir diğeri “soyut mu somut mu” olduğunu yakalayabilir.

Tabii bunlar insan tarafından etiketlenmez.

Model bunları kendi öğrenir.

Ve sonuçta: her metin, yüzlerce boyutlu uzayda bir noktaya yerleşir.

Basit Örnek

Diyelim kullanıcı şunu yazdı:

“AI çağında web sitesi görünürlüğü nasıl artırılır?”

Senin içeriğinde şu başlık var:

“Generative Engine Optimization ile discoverability artırma”

Klasik SEO:

exact keyword yok diye bunu kaçırabilir.

Vector retrieval:

ikisinin semantik olarak yakın olduğunu anlar.

Ve seni retrieve eder.

Yani: kelime eşleşmesi değil, anlam yakınlığı kazanır.

Teknik Olarak Ne Oluyor?

Metin → embedding modeline giriyor.

Örneğin:

OpenAI embedding modeli
Google Gemini embedding sistemi
Cohere embed
Meta embedding modelleri
Voyage AI

şunu yapıyor:

"SEO ve GEO ilişkisi"
↓
[0.281, -0.992, 0.183, 0.445, -0.127, ...]

Yani yazıyı matematiksel koordinata dönüştürüyor.

Sonra kullanıcı sorgusu da aynı şekilde vektöre dönüşüyor.

Sistem: iki vektör arasındaki mesafeyi ölçüyor.

Yakınsa: “bu içerik alakalı” diyor.

Embedding Model Türleri

Burada çoğu SEO’cunun atladığı bir nokta var:

Tek tip embedding modeli yok.

İki büyük aile var.

1. Dense Embeddings

Klasik vector retrieval.

Her metin sabit boyutlu bir vektöre dönüşür.

Anlam yakalamada çok güçlü.

Ama:

nadir kelimelerde,
özel isimlerde,
teknik terimlerde

bazen zayıf kalır.

2. Sparse Embeddings

Çoğu boyutu sıfır olan vektörler.

BM25, SPLADE gibi yöntemler bu aileden.

Spesifik kelime eşleşmesinde güçlü.

3. Hybrid Retrieval

Modern sistemlerin çoğu artık ikisini birden kullanıyor.

Yani:

dense → anlamı yakalar
sparse → spesifik terimi yakalar

İkisinin skoru harmanlanır.

Bu yüzden: sadece “semantik yazmak” yetmez.

Spesifik terimler, marka isimleri, jargon hâlâ önemli.

Vector Database Nedir?

Embedding’ler bir yerde saklanmak zorunda.

Klasik veritabanları bunun için uygun değil.

Çünkü:

milyarlarca yüksek boyutlu vektör,
milisaniyeler içinde yakınlık araması,
sürekli güncellenen index

gerekiyor.

Buna özel veritabanları geliştirildi.

Yaygın Vector Database’ler

Pinecone
Weaviate
Qdrant
Milvus
Chroma
pgvector (Postgres uzantısı)
Vespa

Bunların her biri benzer mantıkla çalışır:

Metni embed et
Vektörü index’e ekle
Sorgu geldiğinde yakınlık ara
En yakın N tanesini döndür

Peki “yakınlık araması” milyarlarca vektörde nasıl bu kadar hızlı yapılıyor?

Index Algoritmaları: HNSW ve FAISS

Tüm vektörleri tek tek karşılaştırmak hesap olarak imkansız.

Bu yüzden:

Approximate Nearest Neighbor (ANN)

algoritmaları kullanılıyor.

En popüler ikisi:

HNSW

Hierarchical Navigable Small World.

Mantık:

Vektörler bir grafik yapısına yerleştirilir.
Katmanlı bir hiyerarşi kurulur.
Üst katmanda kaba, alt katmanda hassas arama yapılır.

Çok hızlı.

Çok ölçeklenebilir.

Modern sistemlerin çoğu bunu kullanır.

FAISS

Facebook AI Similarity Search.

Meta tarafından geliştirildi.

IVF (Inverted File Index)
PQ (Product Quantization)

gibi alt teknikleri var.

Milyarlarca vektörle çalışabilir.

Önemli Olan Ne?

SEO açısından bu detayların hepsini bilmek gerekmiyor.

Ama şunu anlamak şart:

Senin içeriğin gerçekten “en yakın 5” içine girmek için yarışıyor.

Yüzüncü sırada olmak, klasik SERP’in 10. sayfasında olmak gibi.

Var ama görünmüyor.

Cosine Similarity Meselesi

En yaygın yöntem:

Cosine Similarity

Mantık: İki vektör aynı yöne bakıyorsa, anlamları benzerdir.

Yaklaşık olarak:

0.95 → aşırı benzer
0.80 → yakın
0.50 → zayıf ilişki
0.10 → alakasız

AI retrieval sistemleri çoğunlukla buna benzer mantıklarla çalışır.

Ama tek yöntem değil.

Diğer mesafe ölçüleri:

Euclidean distance
Dot product
Manhattan distance

Çoğu sistem cosine veya dot product kullanır.

Çünkü: yön → anlam, uzunluk → güven

olarak yorumlanabilir.

SEO İçin Neden Kritik?

Çünkü artık:

exact keyword dominance ölüyor.

Eski SEO:

H1’e keyword koy
density artır
exact match yap

Yeni sistem:

“Bu doküman gerçekten bu konuyu kapsıyor mu?”

Yani:

semantic completeness
entity richness
contextual relevance
information gain

çok daha önemli hale geliyor.

Eskiden bir sayfa “istanbul seo uzmanı” araması için yazılırdı.

Şimdi bir sayfa:

SEO uzmanlığının ne olduğunu,
nasıl yapıldığını,
hangi araçlarla çalıştığını,
nasıl ölçüldüğünü,
hangi sektörlere uygulandığını

anlatabiliyorsa retrieve edilir.

Vector Retrieval SEO’yu Nasıl Değiştiriyor?

1. Keyword yerine Topic Cluster

Eskiden:

“istanbul seo uzmanı”
“istanbul seo danışmanı”
“istanbul seo hizmeti”

ayrı sayfa yapılırdı.

Şimdi sistem: bunların aynı intent ailesi olduğunu anlayabiliyor.

Bu yüzden: topical authority önemli.

Yani: tek bir konuyu derinlemesine işleyen sayfa, yüzlerce yüzeysel sayfadan daha güçlü.

2. Entity SEO Güçleniyor

AI sistemleri:

kişi,
marka,
konu,
teknoloji,
ilişki

haritaları kuruyor.

Örneğin:

“Gülşah Arslan → GEO → AI SEO → semantic retrieval”

ilişkisi tekrar tekrar görünürse, vektörel yakınlık güçleniyor.

Bu yüzden entity association çok kritik.

Bir markayı, kişiyi veya kavramı:

tanımlı,
bağlamlı,
ilişkili

şekilde anmak, modelin “knowledge graph” benzeri yapısında o entity’yi netleştirir.

3. İçerik “Chunk” Mantığıyla Okunuyor

LLM sistemleri genelde sayfayı:

bloklara,
chunk’lara,
semantik parçalara

ayırır.

Yani 4000 kelimelik yazının tamamı değil, belirli bölümü retrieve edilir.

Bu yüzden:

net heading,
semantik segmentasyon,
iyi yapı,
bilgi yoğunluğu

önemli.

Chunking Stratejileri

Burası kritik.

Çünkü içeriğin retrieve edilip edilmemesi, yazılış kalitesinden önce nasıl parçalandığına bağlı.

1. Fixed-size Chunking

En basit yöntem.

İçerik mesela 500 token’lık bloklara bölünür.

Avantaj: hızlı. Dezavantaj: cümleler ortadan kesilebilir.

Kötü chunking örneği:

Chunk 1: “…vector retrieval sistemleri, kullanıcının sorgusunu” Chunk 2: “embedding’e dönüştürdükten sonra…”

İki chunk da kendi başına eksik anlam taşıyor.

2. Semantic Chunking

İçerik anlam birimlerine göre bölünür.

Genelde:

paragraf sınırları,
başlık geçişleri,
konu değişimleri

dikkate alınır.

İyi yapılandırılmış yazılar bu yöntemden büyük avantaj sağlar.

3. Recursive Chunking

İçerik hiyerarşik olarak bölünür:

önce bölümlere,
sonra paragraflara,
sonra cümlelere.

Modern RAG sistemleri sıklıkla bunu kullanır.

Neden Önemli?

Çünkü:

Senin yazın bir bütün olarak retrieve edilmez. Bir parçası retrieve edilir.

Yani her bölümün:

kendi başına anlamlı,
bağlamı net,
yeterince bilgi taşıyan

olması gerekiyor.

Bağlam dışı bırakılınca havada kalan paragraflar retrieval’da düşük performans gösterir.

Reranking Katmanı

Çoğu insan vector retrieval’ı tek aşamalı sanıyor.

Aslında değil.

Modern sistemlerde genellikle iki aşama var.

Aşama 1: Retrieval

Vector search yapılır.

Mesela milyonlarca dokümandan en yakın 100 chunk getirilir.

Hızlı ama kaba.

Aşama 2: Reranking

Bu 100 chunk daha güçlü bir modelle yeniden sıralanır.

Genelde cross-encoder kullanılır.

Cross-encoder:

sorgu ve dokümanı birlikte okur,
alaka skorunu daha hassas hesaplar.

Yani:

İlk aşamada listeye girmek yetmez. Reranking aşamasında da güçlü olmak gerek.

Reranking’de ne kazanır?

net cevap veren chunk’lar
doğrudan ilişkili paragraflar
bilgi yoğun bölümler
iyi yazılmış kısa açıklamalar

Reranking’de ne kaybeder?

uzun girizgâhlar
“şimdi sana anlatacağım” tarzı dolgu
keyword tekrarı ama bilgi az olan içerik
belirsiz, çok genel ifadeler

RAG Sistemlerinde Kullanımı

Modern AI sistemlerinin çoğu:

RAG

(Retrieval-Augmented Generation)

kullanıyor.

Mantık:

Soru gelir
Vector search yapılır
En alakalı içerikler çekilir
Reranking ile sıralanır
AI cevabı bunlardan üretir
Kaynak olarak sayfaya atıf yapılabilir

Yani: ChatGPT benzeri sistemlerde görünür olmak istiyorsan, vector retrieval’a optimize olmalısın.

Bu artık yeni SEO alanı.

RAG Akışında Sayfan Nerede?

Bir kullanıcının sorgusu geldiğinde sistemin yaptığı şey aslında bir filtre zinciridir.

Sayfanın bu zinciri geçmesi için:

1. Embedding’i sorguya yakın olmalı

Yani konu örtüşmeli.

2. Chunk’ları net olmalı

Parçalandığında anlam kaybetmemeli.

3. Reranker tarafından beğenilmeli

Yani spesifik ve bilgi yoğun olmalı.

4. Modelin “alıntılanabilir” gördüğü formatta olmalı

Yani:

iddialar net,
kaynaklar açık,
tanımlar belirgin
listeler okunaklı

olmalı.

Bu zincirin herhangi bir halkasında zayıfsan sayfan görünmüyor.

GEO ile İlişkisi

GEO’nun temelinde aslında şu var:

“AI sistemleri tarafından retrieve edilmeye uygun içerik üretmek.”

Yani:

semantik netlik,
entity yoğunluğu,
bilgi organizasyonu,
citation değeri,
retrieval suitability

optimizasyonu.

Bu yüzden GEO aslında:

“vector retrieval optimization”

olarak da düşünülebilir.

GEO = Generative Engine Optimization RRO = Retrieval-Ready Optimization

İkisi neredeyse aynı şeyin iki ismi.

Tek fark:

GEO → çıktıya odaklı (AI cevabında görünmek)
RRO → girdiye odaklı (retrieve edilmek)

Ama iş pratikte birleşiyor.

Context Window Mantığı

Vector retrieval sadece “neyi getireceğim” sorusu değil.

Aynı zamanda:

“Getirdiğim şeyi modele nasıl sunacağım?”

sorusu.

Çünkü LLM’lerin sınırlı bir context window’u var.

Yani modele bir seferde verebileceğin token miktarı sınırlı.

GPT-4o → 128k token
Claude → 200k token
Gemini 1.5 Pro → 1M+ token

Ama büyük olması her şeyi koyman gerektiği anlamına gelmiyor.

“Lost in the Middle” Sorunu

Araştırmalar gösterdi ki:

Context’in başına konan bilgi → güçlü hatırlanır
Sonuna konan bilgi → orta düzeyde hatırlanır
Ortaya konan bilgi → genellikle kaybolur

Yani LLM context’in ortasındaki bilgiyi sıklıkla atlıyor.

Bu yüzden retrieval sistemleri:

en güçlü 3-5 chunk’ı seçer,
en alakalıyı ilk sıraya koyar,
gerisini eler.

Bu Sayfan İçin Ne Demek?

Senin chunk’ın:

en üst 3-5 içine girmeli,
tek başına anlamlı olmalı,
model “bu yeter” diyebileceği netlikte olmalı.

İyi içeriğin uzun değil, ilk olarak çağırılabilir olması gerekiyor.

Multilingual Embedding ve Türkçe İçerik

Türkiye’deki çoğu SEO’cunun gözden kaçırdığı bir konu var:

Embedding modelleri her dilde aynı performansı göstermez.

İngilizce, eğitim verisinin büyük çoğunluğu olduğu için genelde en yüksek performansı verir.

Türkçe için durum biraz farklı.

İyi Haber

Modern embedding modelleri (OpenAI text-embedding-3, Cohere embed-multilingual-v3, BGE-M3) Türkçe’de oldukça iyi çalışıyor.

Dikkat Edilmesi Gerekenler

Türkçe morfolojisi zengin: “ev”, “evde”, “evden”, “evimden” hepsi farklı token.
Modeller artık bunları büyük ölçüde aynı kavrama bağlıyor ama hâlâ kayıp olabiliyor.
Teknik terim İngilizce yazılırsa bazı sorgularda daha güçlü retrieve oluyor.
“SEO uzmanı” + “Search Engine Optimization” beraber geçen sayfalar daha güçlü.

Pratik Çıkarım

Türkçe içerik yazarken:

Yabancı terimi parantez içinde verme alışkanlığı dene
Marka, teknoloji, araç isimlerini orijinal şekilde yaz
Hem Türkçe hem İngilizce karşılığını içeriğe yedir

Bu, bilingual retrieval’da büyük avantaj sağlar.

Pratik Örnek: Bir Sorgunun Yolculuğu

Bir kullanıcı ChatGPT’ye şunu yazdı:

“AI sistemlerinde içeriğim nasıl daha sık çağırılır?”

Bu sorgunun sistemde geçirdiği yolculuğa bakalım.

Adım 1: Sorgu Embedding’i

Sistem önce sorguyu embedding’e çevirir.

Yaklaşık 1500+ boyutlu bir vektör oluşur.

Adım 2: Vector Search

Vector database’de en yakın 100-500 chunk bulunur.

Burada hız önemli, hassasiyet ikinci planda.

Senin “GEO optimizasyonu nasıl yapılır” başlıklı sayfan, “AI retrieval” başlıklı sayfan, “içerik chunk’lama stratejileri” sayfan listeye girmiş olabilir.

Adım 3: Reranking

İlk 100 chunk daha güçlü bir modelden geçer.

Yeniden sıralanır.

spesifik tanım içerenler yükselir
dolgu içerenler düşer
sorguyla doğrudan örtüşenler en üste çıkar

Adım 4: Top-K Seçim

Genelde top 3, 5 veya 10 chunk seçilir.

Adım 5: Generation

LLM bu chunk’ları context’ine alıp cevap üretir.

Eğer chunk’ın bu zincirden çıkmadan kalırsa:

alıntılanırsın
kaynak olarak gösterilirsin
bazen direkt paragrafın aktarılır

Eğer reranking’de elenirsen:

hiç var olmamış sayılırsın

Klasik SERP’te 2. sayfada olmak gibi değil bu.

Tamamen görünmez.

Pratik Örnek: İki İçerik, Aynı Konu

Aynı konuyu işleyen iki sayfa düşünelim.

Sayfa A

“Bugün size SEO’nun ne olduğunu anlatacağız. SEO çok önemlidir. Sitenizin Google’da çıkması için SEO yapmanız gerekir. SEO ile ilgili birçok teknik vardır. Bu yazıda hepsini öğreneceksiniz…”

Sayfa B

“SEO (Search Engine Optimization), bir web sayfasının arama motorlarındaki organik görünürlüğünü artırma sürecidir. Üç ana katmanı vardır: teknik SEO (crawl, index, hız), içerik SEO (semantik kapsama, intent eşleşmesi) ve otorite SEO (backlink, mention, entity ilişkisi).”

Klasik Google bunlardan birini sıralayabilir.

Ama vector retrieval için fark net.

Sayfa A:

dolgu yoğun
bilgi düşük
anlam dağınık
chunk’ı retrieve edilse bile cevap üretmiyor

Sayfa B:

tanım net
yapı belirgin
entity ilişkisi açık
tek chunk bile bağlamsız anlamlı

Reranker’ın hangisini seçeceği belli.

Yaygın Hatalar

Vector retrieval’a hazırlık yaparken en sık görülen hatalar:

1. Girizgâh Şişirme

İçeriğin başına 200 kelimelik “merhaba, bugün şunu anlatacağız” yazmak.

Bu chunk retrieve edilirse hiçbir işe yaramaz.

2. Tanımları Geciktirmek

“Bu kavrama gelmeden önce şunu anlatmalıyım…” mantığı.

LLM’ler tanımı arar. Bulamazsa başka kaynağa gider.

3. Aynı Şeyi Tekrar Etmek

Embedding modelleri tekrarı sever sanılıyor.

Aslında tersi.

Tekrar eden semantik içerik düşük information gain demek.

4. Bağlamı Atlamak

“Bu yöntemin nasıl çalıştığını biliyorsun zaten” demek.

Hayır, retrieve edildiğinde kimse bilmiyor.

Her chunk kendi içinde anlamlı olmalı.

5. Spesifik Olmamak

“Birçok teknik var”, “çeşitli yöntemler bulunuyor” gibi ifadeler reranker tarafından zayıf bulunur.

İsim ver. Örnek ver. Sayı ver.

6. Heading’leri Önemsizleştirmek

H2, H3 yapısı:

chunking algoritmalarını yönlendirir,
okuyucu için olduğu kadar makine için de işarettir.

Düz metin bloğu retrieval için kötü.

Bir Sayfayı Retrieval-Ready Hale Getirmek

Pratik kontrol listesi:

Yapı

Net H1
Bölüm bölüm H2
Alt başlıklarda H3
Kısa paragraflar
Listelerden faydalanma

İçerik

Her bölümün açılışında tanım veya iddia
Her bölümün bağımsız anlam taşıması
Spesifik isim, örnek, sayı kullanımı
Jargon ve terim doğru yerde
Marka, kişi, teknoloji isimleri açıkça geçiyor

Bilgi Yoğunluğu

Dolgu cümlesi yok
“Bunu birazdan anlatacağım” yapısı yok
Tanımlar geciktirilmiyor
Bir paragraf, bir fikir

Entity Bağı

Konuyla ilişkili entity’ler net geçiyor
İlişkiler açıklanıyor
Eş anlamlı ifadeler kullanılıyor

Format

Listeler okunaklı
Kod, örnek, alıntı net
Tablolar kısa ve anlamlı
Görseller alt metinli

Ölçüm: Retrieval Suitability Nasıl Test Edilir?

Bu kısım çoğu SEO’cunun bilmediği bir alan.

1. Embedding Similarity Testi

Sayfanı embedding’e çevir.

Hedef sorguları embedding’e çevir.

Cosine similarity’ye bak.

0.80 üstü → çok iyi
0.65 – 0.80 → iyi
0.50 – 0.65 → orta
0.50 altı → zayıf

2. Chunk Bazlı Test

İçeriğini 300-500 token’lık parçalara böl.

Her chunk’ı sorguya karşı test et.

Bazı chunk’lar yüksek skor verirken bazıları çok düşük kalabilir.

Düşük skorlu chunk’ları:

yeniden yaz,
netleştir,
daha spesifik hale getir.

3. LLM Citation Testi

ChatGPT, Perplexity, Claude gibi sistemlere hedef sorguyu sor.

Senin sayfan kaynak olarak çıkıyor mu?

Çıkmıyorsa hangi sayfalar çıkıyor?

Onları analiz et:

yapısı nasıl,
bilgi yoğunluğu nasıl,
hangi entity’leri kullanıyor,
hangi formatları kullanıyor.

4. Reranking Simülasyonu

Open source reranker modelleri var.

Sayfanı + sorguyu reranker’a verip gerçek skorları görmek mümkün.

Bu, klasik SEO’daki rank tracking’in AI versiyonu sayılabilir.

Şimdi En Kritik Kısım

Birçok SEO’cu hâlâ:

title,
meta,
keyword density

seviyesinde.

Ama oyun başka yere geçti.

Kazananlar: AI’nin bilgiyi nasıl çağırdığını anlayanlar olacak.

Çünkü gelecekte sıralama şöyle işleyecek:

“Bu sayfa kaçıncı sırada?” yerine “Bu bilgi modeli bu kaynağı retrieve etmeye değer görüyor mu?”

sorusu önemli olacak.

Ve işte savaş artık burada dönüyor.

Önümüzdeki 12 Ayda Beklenenler

Birkaç eğilim çok netleşiyor:

1. Klasik SERP eriyor

Kullanıcılar artık 10 mavi linke tıklamıyor.

AI cevabını alıp ayrılıyor.

Bu trafik kaybı değil.

Görünürlük türünün değişmesi.

2. Citation görünürlüğü yeni rank

AI cevabında kaynak olarak geçmek

sırada olmaktan değerli hale geliyor.

3. Entity authority yükseliyor

Bir kişi, marka veya konunun modelin dünya bilgisinde “tanınmış entity” olması artık SEO’nun parçası.

4. Yeni metrikler geliyor

citation share
retrieval frequency
answer presence rate
entity association score

gibi yeni göstergeler oluşacak.

5. İçerik formatı evrilecek

Kısa cevaplı, tanım yoğun, listelenebilir ve chunk-friendly formatlar uzun girizgâhlı içerikleri ezecek.

Sektörel Uygulama: Hangi Sektör Ne Yapmalı?

Vector retrieval optimizasyonu her sektörde aynı çalışmıyor.

E-ticaret

Ürün açıklamalarında “ne olduğu + kime uygun + nasıl kullanıldığı” üçlüsü
Kategori sayfalarında semantik kapsama
Karşılaştırma içerikleri reranker’da çok güçlü
“X vs Y” tarzı sayfalar AI alıntılarında öne çıkıyor

B2B / SaaS

Çözüm odaklı tanım yapısı kritik
Use case bazlı chunk’lar değerli
Entity ilişkisi (ürün – sorun – sektör – persona) önemli
Glossary sayfaları AI sistemlerinde çok sık retrieve ediliyor

Yerel Hizmet

Şehir + hizmet + niş üçlüsü
Müşteri sorularına net cevap veren chunk’lar
“Nasıl yapılır” formatı güçlü
Coğrafi entity’lerle güçlü ilişkilenme

Yayıncılık / Blog

Tanım yoğun açılışlar
Liste ve karşılaştırma formatları
Spesifik veri ve kaynak referansları
Otorite işaretleri (yazar, tarih, güncelleme)

Kişisel Marka

Tutarlı entity tanımı (her sayfada aynı kimlikle anılma)
Konu-kişi ilişkisinin tekrarı
“X uzmanı Y” yapısının netliği
Cross-platform tutarlılık

Sıkça Sorulan Sorular

Vector retrieval klasik SEO’yu öldürür mü?

Hayır. Üzerine bir katman ekliyor.

Klasik SEO sinyalleri (link, hız, mobil uyum) hâlâ çalışıyor.

Üstüne semantik kalite ve retrieval suitability gerekiyor.

Bütün sayfalar uzun mu olmalı?

Hayır. Önemli olan bilgi yoğunluğu.

500 kelimelik net bir tanım sayfası, 4000 kelimelik dağınık yazıdan iyi performans gösterebilir.

Keyword araştırması bitti mi?

Bitmedi. Ama değişti.

Artık keyword değil, intent ve entity araştırması yapılıyor.

Bir keyword’ün arkasındaki kavram ağı çıkarılıyor.

Kaç chunk olmalı?

Bu sayfanın algoritmik bir parçası.

Senin işin: her bölümün kendi başına anlamlı olmasını sağlamak.

Geri kalanı sistem halleder.

AI sistemleri sayfamı nereden öğreniyor?

İki yolla:

Crawler ile (Bingbot, Googlebot, ChatGPT user agent vs.)
Sayfan zaten bir veritabanında (Common Crawl gibi) ise oradan

Yani crawl edilebilirlik hâlâ kritik.

Robots.txt ile AI bot’larını engellemek GEO açısından intihar.

Schema markup hâlâ önemli mi?

Evet. Hatta daha önemli.

Çünkü schema:

entity tipini netleştirir
ilişkileri formal hale getirir
makine okunabilirliği artırır

Article, Person, Organization, FAQ, HowTo şemaları modern AI sistemlerinde okunuyor.

Backlink hâlâ değerli mi?

Evet. Ama tek başına değil.

Mention (linksiz anılma) artık link kadar değerli olabilir.

Çünkü entity ilişkisi backlink olmadan da kuruluyor.

İçerikler ne sıklıkla güncellenmeli?

Bilgi değiştiğinde.

Düzenli “küçük rötuş” değil, gerçek bilgi güncellemesi önemli.

Tarihi değiştirmek değil, içeriği iyileştirmek.

Information Gain Nedir?

Bu, AI retrieval’da en az anlaşılan ama en önemli kavramlardan biri.

Tanım

Bir içeriğin, mevcut bilgi havuzuna ne kadar yeni bilgi eklediği.

Google’ın da patentlerinde geçen bir terim.

Neden Kritik?

Çünkü bir konuda 1000 sayfa zaten varsa, 1001. sayfa eğer aynı şeyleri söylüyorsa hiçbir değer taşımıyor.

Reranker bunu fark ediyor.

LLM cevap üretirken “yeni” olanı tercih ediyor.

Information Gain Nasıl Artırılır?

1. Orijinal Veri

Kendi araştırman, kendi ölçümlerin, kendi case study’lerin.

2. Yeni Perspektif

Mevcut bilgiyi farklı bir açıdan ele almak.

3. Sentez

Birden çok kaynağı birleştirip yeni bir model çıkarmak.

4. Spesifik Örnekler

Genel anlatımı değil, sayısal-isimli örnekleri tercih etmek.

5. Karşıt Görüş

Mevcut görüşe argümanlı itiraz değerli.

Information Gain’i Düşük İçerik Belirtileri

“Şu konu çok önemli, bilmeniz gerekenler…”
“X şudur, Y şudur, Z şudur” listesi (Wikipedia paraphrase’i)
Tanım + tanım + tanım yığını
Hiç sayı, hiç örnek, hiç vaka yok
Yazar yok, kaynak yok, ölçüm yok

Bu tip içerik retrieve edilse bile reranker tarafından eleniyor.

Information Gain’i Yüksek İçerik

“X şirketinde 6 ay boyunca Y yöntemini test ettik. Sonuç: Z.”
“100 kişilik kontrol grubunda şu farkı ölçtük.”
“Mevcut literatür A diyor, ama bizim bulgumuz B.”
“X yöntemini denedik, beklediğimiz olmadı, sebebi şu çıktı.”

Bu içerikler AI sistemlerinde çok daha sık alıntılanıyor.

AI Crawler’ları ve Erişilebilirlik

Vector retrieval mantığı içeriğin AI sistemlerine ulaşmasını gerektiriyor.

Bu da modern bir crawl konusu.

AI Bot’ları Kimler?

GPTBot (OpenAI)
ChatGPT-User (ChatGPT browsing)
PerplexityBot
ClaudeBot
Claude-Web
Google-Extended (Gemini için)
Applebot-Extended

Bu bot’lar:

sayfa indirir,
metni çıkartır,
embedding’e dönüştürür,
sistemde saklar.

Tipik Hata

Birçok site robots.txt’inde GPTBot’u, ClaudeBot’u, Google-Extended’ı bloklamış durumda.

Sebep genelde:

telif kaygısı,
“AI bizim içeriğimizi kullanmasın” anlayışı.

Sorun

Bu engelleme AI cevaplarında görünmemekle sonuçlanıyor.

Yani:

Telif kaygısıyla AI bot’unu kapatan site, AI çıktısında hiç anılmıyor.

Bu trafik kaybı değil, görünürlük kaybı.

Doğru Yaklaşım

AI bot’larına izin ver
Sayfaların hızlı yüklensin
JavaScript’e kritik içerik gömme — bazı bot’lar JS render etmiyor
Server-side rendering veya hibrit yapı tercih et
Sitemap’leri güncel tut
Meta description ve schema’yı zenginleştir

Prompt-Based Test Yöntemleri

İçeriğinin AI sistemlerinde nasıl performans verdiğini ölçmenin pratik yolları var.

Yöntem 1: Doğrudan Sorgu Testi

Hedef sorgunu ChatGPT’ye, Perplexity’ye, Claude’a sor.

Bak:

Kaynak listesi var mı?
Senin sayfan listede mi?
Hangi paragraf alıntılanmış?
Hangi yapı kullanılmış?

Yöntem 2: Sayfa Bazlı Test

Sayfanın URL’ini doğrudan AI’a ver:

“Bu sayfa neyi anlatıyor, ana iddiası ne, hangi sorulara cevap veriyor?”

AI’nın özetlediği şey senin yazdığını sandığın şeyle örtüşüyor mu?

Eğer örtüşmüyorsa sayfan retrieve edildiğinde yanlış cevap üretebilir.

Yöntem 3: Karşılaştırma Testi

AI’a şunu sor:

“[Senin sayfan] ve [rakip sayfa] arasında hangisini daha güvenilir bir kaynak olarak önerirsin? Neden?”

Cevabın gerekçesi sayfan hakkında çok şey söyler.

Yöntem 4: Chunk Testi

Sayfanın bir paragrafını alıp şunu sor:

“Bu metin tek başına şu soruya cevap veriyor mu: [hedef sorgu]?”

Eğer cevap “evet, açıkça” değilse o chunk retrieval’da zayıf demektir.

Yöntem 5: Boşluk Testi

“[Konu] hakkında en sık eksik bırakılan bilgi nedir?”

AI’nın söylediği boşluğu sayfanda doldurursan information gain artar.

Uzun Vadeli Strateji

Vector retrieval optimizasyonu tek seferlik bir iş değil.

Aşamalı bir kültürel dönüşüm.

Birinci Aşama: Audit

Mevcut içeriklerinin tamamı için:

embedding similarity skoru
chunk kalitesi
entity netliği
information gain

ölçülmeli.

Zayıf sayfalar listelenmeli.

İkinci Aşama: Restorasyon

Mevcut içerikler:

girizgâhlardan temizlenir
tanımlar öne çekilir
chunk-friendly hale getirilir
entity ilişkileri güçlendirilir

Üçüncü Aşama: Genişleme

Information gain’i yüksek yeni içerikler üretilir:

orijinal araştırma
case study
karşılaştırma
sentez içerikleri

Dördüncü Aşama: İzleme

AI çıktılarında görünürlük takip edilir:

citation share
answer presence
mention frequency
retrieval consistency

Beşinci Aşama: Sürekli İyileştirme

Yeni modeller geldikçe, algoritmalar değiştikçe ölçüm ve iyileştirme döngüsü devam eder.

Tıpkı klasik SEO gibi.

Tek fark: artık savaş kelime üzerinden değil, anlam üzerinden dönüyor.

Özet

Vector retrieval şu üç şeyi anlamak demek:

1. AI metni anlam olarak okur, kelime olarak değil

Bu yüzden semantik kapsama keyword’den önemli.

2. İçerik parçalanarak çağırılır

Bu yüzden her bölümün kendi başına anlamlı ve bağlamlı olması şart.

3. Modelin “alıntılanabilir” bulduğu içerik kazanır

Bu yüzden net tanım, spesifik bilgi, açık entity ilişkisi yeni rank faktörleri.

GEO, SEO’nun yerini almıyor.

SEO’nun bir üst katmanı oluyor.

Klasik SEO’yu bilen, ama vector retrieval mantığını da kavrayan profesyoneller önümüzdeki dönemin asıl kazananları olacak.

Çünkü kelime savaşı bitti.

Anlam savaşı başladı.

Son Söz: Bu İşin Felsefesi

Vector retrieval’ı teknik bir konu olarak görmek en büyük yanılgı.

Aslında bu konu bilgi paylaşımının doğasıyla ilgili.

Eski sistem şunu ödüllendiriyordu:

“Doğru kelimeleri doğru sayıda kullan.”

Yeni sistem ise şunu ödüllendiriyor:

“Gerçekten bir şey biliyor musun, bilmiyor musun?”

Bu yüzden:

dolgu cümlesi yazan içerik üreticileri zorlanacak,
bir konuyu derinden anlayan yazarlar öne çıkacak,
yapay yöntemlerle “SEO yapan” siteler eriyecek,
gerçek otorite sahibi kaynaklar büyüyecek.

Bir bakıma, internet ilk defa “bilgiyi” gerçekten ödüllendirmeye başlıyor.

Klasik SEO bunu vaat etmişti ama tutamadı.

Çünkü kelime sayma mantığı manipüle edilebilirdi.

Anlam ölçme mantığı çok daha zor manipüle ediliyor.

Bu, içerik üreticileri için büyük bir fırsat.

Çünkü artık:

uzun değil, yoğun
gösterişli değil, net
viral değil, kaynak

olan içerik kazanıyor.

Ve eğer gerçekten bir alanda derinleşmişsen, gerçekten yeni bir şey söyleyebiliyorsan, AI sistemleri bunu fark ediyor.

Çünkü onlar da bilgiyi arıyor.

Tıpkı insanlar gibi.

Kapanış

Bu yazıda gördüklerimizi tek paragrafta toplarsak:

Vector retrieval, AI sistemlerinin içeriği kelime değil anlam üzerinden okuduğu, bir embedding modeliyle metni matematiksel uzaya yerleştirip cosine similarity gibi yöntemlerle yakınlık ölçtüğü, chunk bazında parçalayıp reranker’la yeniden sıraladığı ve LLM’in context window’una en güçlü 3-5 parçayı verdiği modern bilgi erişim mantığıdır. SEO bu mantığa göre yeniden yapılandığında entity netliği, semantik kapsama, information gain, chunk-friendly format ve AI crawler erişilebilirliği yeni rank faktörleri haline gelmektedir. GEO, bu yeni dünyada içerikleri retrieval-ready hale getirme disiplinidir ve klasik SEO’nun yerini almak yerine üzerine bir üst katman ekler.

Bu mantığı kavrayan içerik üreticileri, önümüzdeki dönemde “bulunabilir” değil, alıntılanabilir olacak.

Ve fark tam burada.

Author Profile

admin

Latest entries

GEOMayıs 27, 2026Yapay Zeka SEO Uzmanı Seçerken Nelere Dikkat Edilmelidir?
GEOMayıs 19, 2026ChatGPT’de Çıkmayan Markalar İçin GEO Gerçeği: 2026’da Görünmez Kalmamak İçin Bilmeniz Gerekenler
TOOLSMayıs 19, 2026Bing Webmaster Tools Kullanım Kılavuzu
GEOMayıs 17, 2026Generative Engine Optimization ile Discoverability Artırma

Vector Retrieval Nedir? AI Çağında SEO’nun Yeni Temeli

Önce Temel Mantık

Embedding

Embedding’in Boyutu Meselesi

Basit Örnek

Teknik Olarak Ne Oluyor?

Embedding Model Türleri

Tek tip embedding modeli yok.

1. Dense Embeddings

2. Sparse Embeddings

3. Hybrid Retrieval

Vector Database Nedir?

Yaygın Vector Database’ler

Index Algoritmaları: HNSW ve FAISS

Approximate Nearest Neighbor (ANN)

HNSW

FAISS

Önemli Olan Ne?

Cosine Similarity Meselesi

Cosine Similarity

SEO İçin Neden Kritik?

exact keyword dominance ölüyor.

Vector Retrieval SEO’yu Nasıl Değiştiriyor?

1. Keyword yerine Topic Cluster

2. Entity SEO Güçleniyor

3. İçerik “Chunk” Mantığıyla Okunuyor

Chunking Stratejileri

1. Fixed-size Chunking

2. Semantic Chunking

3. Recursive Chunking

Neden Önemli?

Reranking Katmanı

Aşama 1: Retrieval

Aşama 2: Reranking

RAG Sistemlerinde Kullanımı

RAG

RAG Akışında Sayfan Nerede?

1. Embedding’i sorguya yakın olmalı

2. Chunk’ları net olmalı

3. Reranker tarafından beğenilmeli

4. Modelin “alıntılanabilir” gördüğü formatta olmalı

GEO ile İlişkisi

“vector retrieval optimization”

Context Window Mantığı

“Lost in the Middle” Sorunu

Bu Sayfan İçin Ne Demek?

Multilingual Embedding ve Türkçe İçerik

Embedding modelleri her dilde aynı performansı göstermez.

İyi Haber

Dikkat Edilmesi Gerekenler

Pratik Çıkarım

Pratik Örnek: Bir Sorgunun Yolculuğu

Adım 1: Sorgu Embedding’i

Adım 2: Vector Search

Adım 3: Reranking

Adım 4: Top-K Seçim

Adım 5: Generation

Pratik Örnek: İki İçerik, Aynı Konu

Sayfa A

Sayfa B

Yaygın Hatalar

1. Girizgâh Şişirme

2. Tanımları Geciktirmek

3. Aynı Şeyi Tekrar Etmek

4. Bağlamı Atlamak

5. Spesifik Olmamak

6. Heading’leri Önemsizleştirmek

Bir Sayfayı Retrieval-Ready Hale Getirmek

Yapı

İçerik

Bilgi Yoğunluğu

Entity Bağı

Format

Ölçüm: Retrieval Suitability Nasıl Test Edilir?

1. Embedding Similarity Testi

2. Chunk Bazlı Test

3. LLM Citation Testi

4. Reranking Simülasyonu

Şimdi En Kritik Kısım

Önümüzdeki 12 Ayda Beklenenler