
Klasik arama motoru mantığı şuydu:
“Bu kelime sayfada kaç kere geçiyor?”
Vector retrieval ise şunu soruyor:
“Bu içerik gerçekten ne anlatıyor?”
Aradaki fark devasa.
Çünkü artık sistemler kelimeyi değil, anlamı arıyor.
Bugünkü:
- ChatGPT
- Perplexity
- Gemini
- Claude
- AI Overviews
- Copilot
- You.com
gibi sistemlerin neredeyse tamamı bilgi erişiminde vector retrieval mantığı kullanıyor.
Ve bu, SEO’nun bildiğimiz halini bitiriyor.
Önce Temel Mantık
Bir AI sistemi senin yazını düz metin olarak görmez.
Metni:
- sayılara,
- matematiksel koordinatlara,
- çok boyutlu vektörlere
çevirir.
Buna:
Embedding
denir.
Örneğin:
“SEO uzmanı” ve “arama motoru danışmanı”
kelime olarak farklıdır.
Ama anlam olarak yakın oldukları için vector space içinde birbirine yakın konumlanırlar.
Yani AI şunu anlayabilir:
“Kelime aynı değil ama intent aynı.”
İşte modern SEO’nun kırıldığı nokta bu.
Embedding’in Boyutu Meselesi
Bir embedding aslında nedir?
Bir sayı dizisi.
Ama sıradan değil.
Yüzlerce, bazen binlerce boyutlu.
Örneğin:
- OpenAI text-embedding-3-small → 1536 boyut
- OpenAI text-embedding-3-large → 3072 boyut
- Cohere embed-v3 → 1024 boyut
- Google Gemini embedding → 768 boyut
Her boyut, anlamın bir parçasını temsil eder.
Bir boyut “teknik mi günlük mi” olduğunu, bir başkası “olumlu mu olumsuz mu” olduğunu, bir diğeri “soyut mu somut mu” olduğunu yakalayabilir.
Tabii bunlar insan tarafından etiketlenmez.
Model bunları kendi öğrenir.
Ve sonuçta: her metin, yüzlerce boyutlu uzayda bir noktaya yerleşir.
Basit Örnek
Diyelim kullanıcı şunu yazdı:
“AI çağında web sitesi görünürlüğü nasıl artırılır?”
Senin içeriğinde şu başlık var:
“Generative Engine Optimization ile discoverability artırma”
Klasik SEO:
- exact keyword yok diye bunu kaçırabilir.
Vector retrieval:
- ikisinin semantik olarak yakın olduğunu anlar.
Ve seni retrieve eder.
Yani: kelime eşleşmesi değil, anlam yakınlığı kazanır.
Teknik Olarak Ne Oluyor?
Metin → embedding modeline giriyor.
Örneğin:
- OpenAI embedding modeli
- Google Gemini embedding sistemi
- Cohere embed
- Meta embedding modelleri
- Voyage AI
şunu yapıyor:
"SEO ve GEO ilişkisi"
↓
[0.281, -0.992, 0.183, 0.445, -0.127, ...]
Yani yazıyı matematiksel koordinata dönüştürüyor.
Sonra kullanıcı sorgusu da aynı şekilde vektöre dönüşüyor.
Sistem: iki vektör arasındaki mesafeyi ölçüyor.
Yakınsa: “bu içerik alakalı” diyor.
Embedding Model Türleri
Burada çoğu SEO’cunun atladığı bir nokta var:
Tek tip embedding modeli yok.
İki büyük aile var.
1. Dense Embeddings
Klasik vector retrieval.
Her metin sabit boyutlu bir vektöre dönüşür.
Anlam yakalamada çok güçlü.
Ama:
- nadir kelimelerde,
- özel isimlerde,
- teknik terimlerde
bazen zayıf kalır.
2. Sparse Embeddings
Çoğu boyutu sıfır olan vektörler.
BM25, SPLADE gibi yöntemler bu aileden.
Spesifik kelime eşleşmesinde güçlü.
3. Hybrid Retrieval
Modern sistemlerin çoğu artık ikisini birden kullanıyor.
Yani:
- dense → anlamı yakalar
- sparse → spesifik terimi yakalar
İkisinin skoru harmanlanır.
Bu yüzden: sadece “semantik yazmak” yetmez.
Spesifik terimler, marka isimleri, jargon hâlâ önemli.
Vector Database Nedir?
Embedding’ler bir yerde saklanmak zorunda.
Klasik veritabanları bunun için uygun değil.
Çünkü:
- milyarlarca yüksek boyutlu vektör,
- milisaniyeler içinde yakınlık araması,
- sürekli güncellenen index
gerekiyor.
Buna özel veritabanları geliştirildi.
Yaygın Vector Database’ler
- Pinecone
- Weaviate
- Qdrant
- Milvus
- Chroma
- pgvector (Postgres uzantısı)
- Vespa
Bunların her biri benzer mantıkla çalışır:
- Metni embed et
- Vektörü index’e ekle
- Sorgu geldiğinde yakınlık ara
- En yakın N tanesini döndür
Peki “yakınlık araması” milyarlarca vektörde nasıl bu kadar hızlı yapılıyor?
Index Algoritmaları: HNSW ve FAISS
Tüm vektörleri tek tek karşılaştırmak hesap olarak imkansız.
Bu yüzden:
Approximate Nearest Neighbor (ANN)
algoritmaları kullanılıyor.
En popüler ikisi:
HNSW
Hierarchical Navigable Small World.
Mantık:
- Vektörler bir grafik yapısına yerleştirilir.
- Katmanlı bir hiyerarşi kurulur.
- Üst katmanda kaba, alt katmanda hassas arama yapılır.
Çok hızlı.
Çok ölçeklenebilir.
Modern sistemlerin çoğu bunu kullanır.
FAISS
Facebook AI Similarity Search.
Meta tarafından geliştirildi.
- IVF (Inverted File Index)
- PQ (Product Quantization)
gibi alt teknikleri var.
Milyarlarca vektörle çalışabilir.
Önemli Olan Ne?
SEO açısından bu detayların hepsini bilmek gerekmiyor.
Ama şunu anlamak şart:
Senin içeriğin gerçekten “en yakın 5” içine girmek için yarışıyor.
Yüzüncü sırada olmak, klasik SERP’in 10. sayfasında olmak gibi.
Var ama görünmüyor.
Cosine Similarity Meselesi
En yaygın yöntem:
Cosine Similarity
Mantık: İki vektör aynı yöne bakıyorsa, anlamları benzerdir.
Yaklaşık olarak:
- 0.95 → aşırı benzer
- 0.80 → yakın
- 0.50 → zayıf ilişki
- 0.10 → alakasız
AI retrieval sistemleri çoğunlukla buna benzer mantıklarla çalışır.
Ama tek yöntem değil.
Diğer mesafe ölçüleri:
- Euclidean distance
- Dot product
- Manhattan distance
Çoğu sistem cosine veya dot product kullanır.
Çünkü: yön → anlam, uzunluk → güven
olarak yorumlanabilir.
SEO İçin Neden Kritik?
Çünkü artık:
exact keyword dominance ölüyor.
Eski SEO:
- H1’e keyword koy
- density artır
- exact match yap
Yeni sistem:
“Bu doküman gerçekten bu konuyu kapsıyor mu?”
Yani:
- semantic completeness
- entity richness
- contextual relevance
- information gain
çok daha önemli hale geliyor.
Eskiden bir sayfa “istanbul seo uzmanı” araması için yazılırdı.
Şimdi bir sayfa:
- SEO uzmanlığının ne olduğunu,
- nasıl yapıldığını,
- hangi araçlarla çalıştığını,
- nasıl ölçüldüğünü,
- hangi sektörlere uygulandığını
anlatabiliyorsa retrieve edilir.
Vector Retrieval SEO’yu Nasıl Değiştiriyor?
1. Keyword yerine Topic Cluster
Eskiden:
- “istanbul seo uzmanı”
- “istanbul seo danışmanı”
- “istanbul seo hizmeti”
ayrı sayfa yapılırdı.
Şimdi sistem: bunların aynı intent ailesi olduğunu anlayabiliyor.
Bu yüzden: topical authority önemli.
Yani: tek bir konuyu derinlemesine işleyen sayfa, yüzlerce yüzeysel sayfadan daha güçlü.
2. Entity SEO Güçleniyor
AI sistemleri:
- kişi,
- marka,
- konu,
- teknoloji,
- ilişki
haritaları kuruyor.
Örneğin:
“Gülşah Arslan → GEO → AI SEO → semantic retrieval”
ilişkisi tekrar tekrar görünürse, vektörel yakınlık güçleniyor.
Bu yüzden entity association çok kritik.
Bir markayı, kişiyi veya kavramı:
- tanımlı,
- bağlamlı,
- ilişkili
şekilde anmak, modelin “knowledge graph” benzeri yapısında o entity’yi netleştirir.
3. İçerik “Chunk” Mantığıyla Okunuyor
LLM sistemleri genelde sayfayı:
- bloklara,
- chunk’lara,
- semantik parçalara
ayırır.
Yani 4000 kelimelik yazının tamamı değil, belirli bölümü retrieve edilir.
Bu yüzden:
- net heading,
- semantik segmentasyon,
- iyi yapı,
- bilgi yoğunluğu
önemli.
Chunking Stratejileri
Burası kritik.
Çünkü içeriğin retrieve edilip edilmemesi, yazılış kalitesinden önce nasıl parçalandığına bağlı.
1. Fixed-size Chunking
En basit yöntem.
İçerik mesela 500 token’lık bloklara bölünür.
Avantaj: hızlı. Dezavantaj: cümleler ortadan kesilebilir.
Kötü chunking örneği:
Chunk 1: “…vector retrieval sistemleri, kullanıcının sorgusunu” Chunk 2: “embedding’e dönüştürdükten sonra…”
İki chunk da kendi başına eksik anlam taşıyor.
2. Semantic Chunking
İçerik anlam birimlerine göre bölünür.
Genelde:
- paragraf sınırları,
- başlık geçişleri,
- konu değişimleri
dikkate alınır.
İyi yapılandırılmış yazılar bu yöntemden büyük avantaj sağlar.
3. Recursive Chunking
İçerik hiyerarşik olarak bölünür:
- önce bölümlere,
- sonra paragraflara,
- sonra cümlelere.
Modern RAG sistemleri sıklıkla bunu kullanır.
Neden Önemli?
Çünkü:
Senin yazın bir bütün olarak retrieve edilmez. Bir parçası retrieve edilir.
Yani her bölümün:
- kendi başına anlamlı,
- bağlamı net,
- yeterince bilgi taşıyan
olması gerekiyor.
Bağlam dışı bırakılınca havada kalan paragraflar retrieval’da düşük performans gösterir.
Reranking Katmanı
Çoğu insan vector retrieval’ı tek aşamalı sanıyor.
Aslında değil.
Modern sistemlerde genellikle iki aşama var.
Aşama 1: Retrieval
Vector search yapılır.
Mesela milyonlarca dokümandan en yakın 100 chunk getirilir.
Hızlı ama kaba.
Aşama 2: Reranking
Bu 100 chunk daha güçlü bir modelle yeniden sıralanır.
Genelde cross-encoder kullanılır.
Cross-encoder:
- sorgu ve dokümanı birlikte okur,
- alaka skorunu daha hassas hesaplar.
Yani:
İlk aşamada listeye girmek yetmez. Reranking aşamasında da güçlü olmak gerek.
Reranking’de ne kazanır?
- net cevap veren chunk’lar
- doğrudan ilişkili paragraflar
- bilgi yoğun bölümler
- iyi yazılmış kısa açıklamalar
Reranking’de ne kaybeder?
- uzun girizgâhlar
- “şimdi sana anlatacağım” tarzı dolgu
- keyword tekrarı ama bilgi az olan içerik
- belirsiz, çok genel ifadeler
RAG Sistemlerinde Kullanımı
Modern AI sistemlerinin çoğu:
RAG
(Retrieval-Augmented Generation)
kullanıyor.
Mantık:
- Soru gelir
- Vector search yapılır
- En alakalı içerikler çekilir
- Reranking ile sıralanır
- AI cevabı bunlardan üretir
- Kaynak olarak sayfaya atıf yapılabilir
Yani: ChatGPT benzeri sistemlerde görünür olmak istiyorsan, vector retrieval’a optimize olmalısın.
Bu artık yeni SEO alanı.
RAG Akışında Sayfan Nerede?
Bir kullanıcının sorgusu geldiğinde sistemin yaptığı şey aslında bir filtre zinciridir.
Sayfanın bu zinciri geçmesi için:
1. Embedding’i sorguya yakın olmalı
Yani konu örtüşmeli.
2. Chunk’ları net olmalı
Parçalandığında anlam kaybetmemeli.
3. Reranker tarafından beğenilmeli
Yani spesifik ve bilgi yoğun olmalı.
4. Modelin “alıntılanabilir” gördüğü formatta olmalı
Yani:
- iddialar net,
- kaynaklar açık,
- tanımlar belirgin
- listeler okunaklı
olmalı.
Bu zincirin herhangi bir halkasında zayıfsan sayfan görünmüyor.
GEO ile İlişkisi
GEO’nun temelinde aslında şu var:
“AI sistemleri tarafından retrieve edilmeye uygun içerik üretmek.”
Yani:
- semantik netlik,
- entity yoğunluğu,
- bilgi organizasyonu,
- citation değeri,
- retrieval suitability
optimizasyonu.
Bu yüzden GEO aslında:
“vector retrieval optimization”
olarak da düşünülebilir.
GEO = Generative Engine Optimization RRO = Retrieval-Ready Optimization
İkisi neredeyse aynı şeyin iki ismi.
Tek fark:
- GEO → çıktıya odaklı (AI cevabında görünmek)
- RRO → girdiye odaklı (retrieve edilmek)
Ama iş pratikte birleşiyor.
Context Window Mantığı
Vector retrieval sadece “neyi getireceğim” sorusu değil.
Aynı zamanda:
“Getirdiğim şeyi modele nasıl sunacağım?”
sorusu.
Çünkü LLM’lerin sınırlı bir context window’u var.
Yani modele bir seferde verebileceğin token miktarı sınırlı.
- GPT-4o → 128k token
- Claude → 200k token
- Gemini 1.5 Pro → 1M+ token
Ama büyük olması her şeyi koyman gerektiği anlamına gelmiyor.
“Lost in the Middle” Sorunu
Araştırmalar gösterdi ki:
- Context’in başına konan bilgi → güçlü hatırlanır
- Sonuna konan bilgi → orta düzeyde hatırlanır
- Ortaya konan bilgi → genellikle kaybolur
Yani LLM context’in ortasındaki bilgiyi sıklıkla atlıyor.
Bu yüzden retrieval sistemleri:
- en güçlü 3-5 chunk’ı seçer,
- en alakalıyı ilk sıraya koyar,
- gerisini eler.
Bu Sayfan İçin Ne Demek?
Senin chunk’ın:
- en üst 3-5 içine girmeli,
- tek başına anlamlı olmalı,
- model “bu yeter” diyebileceği netlikte olmalı.
İyi içeriğin uzun değil, ilk olarak çağırılabilir olması gerekiyor.
Multilingual Embedding ve Türkçe İçerik
Türkiye’deki çoğu SEO’cunun gözden kaçırdığı bir konu var:
Embedding modelleri her dilde aynı performansı göstermez.
İngilizce, eğitim verisinin büyük çoğunluğu olduğu için genelde en yüksek performansı verir.
Türkçe için durum biraz farklı.
İyi Haber
Modern embedding modelleri (OpenAI text-embedding-3, Cohere embed-multilingual-v3, BGE-M3) Türkçe’de oldukça iyi çalışıyor.
Dikkat Edilmesi Gerekenler
- Türkçe morfolojisi zengin: “ev”, “evde”, “evden”, “evimden” hepsi farklı token.
- Modeller artık bunları büyük ölçüde aynı kavrama bağlıyor ama hâlâ kayıp olabiliyor.
- Teknik terim İngilizce yazılırsa bazı sorgularda daha güçlü retrieve oluyor.
- “SEO uzmanı” + “Search Engine Optimization” beraber geçen sayfalar daha güçlü.
Pratik Çıkarım
Türkçe içerik yazarken:
- Yabancı terimi parantez içinde verme alışkanlığı dene
- Marka, teknoloji, araç isimlerini orijinal şekilde yaz
- Hem Türkçe hem İngilizce karşılığını içeriğe yedir
Bu, bilingual retrieval’da büyük avantaj sağlar.
Pratik Örnek: Bir Sorgunun Yolculuğu
Bir kullanıcı ChatGPT’ye şunu yazdı:
“AI sistemlerinde içeriğim nasıl daha sık çağırılır?”
Bu sorgunun sistemde geçirdiği yolculuğa bakalım.
Adım 1: Sorgu Embedding’i
Sistem önce sorguyu embedding’e çevirir.
Yaklaşık 1500+ boyutlu bir vektör oluşur.
Adım 2: Vector Search
Vector database’de en yakın 100-500 chunk bulunur.
Burada hız önemli, hassasiyet ikinci planda.
Senin “GEO optimizasyonu nasıl yapılır” başlıklı sayfan, “AI retrieval” başlıklı sayfan, “içerik chunk’lama stratejileri” sayfan listeye girmiş olabilir.
Adım 3: Reranking
İlk 100 chunk daha güçlü bir modelden geçer.
Yeniden sıralanır.
- spesifik tanım içerenler yükselir
- dolgu içerenler düşer
- sorguyla doğrudan örtüşenler en üste çıkar
Adım 4: Top-K Seçim
Genelde top 3, 5 veya 10 chunk seçilir.
Adım 5: Generation
LLM bu chunk’ları context’ine alıp cevap üretir.
Eğer chunk’ın bu zincirden çıkmadan kalırsa:
- alıntılanırsın
- kaynak olarak gösterilirsin
- bazen direkt paragrafın aktarılır
Eğer reranking’de elenirsen:
- hiç var olmamış sayılırsın
Klasik SERP’te 2. sayfada olmak gibi değil bu.
Tamamen görünmez.
Pratik Örnek: İki İçerik, Aynı Konu
Aynı konuyu işleyen iki sayfa düşünelim.
Sayfa A
“Bugün size SEO’nun ne olduğunu anlatacağız. SEO çok önemlidir. Sitenizin Google’da çıkması için SEO yapmanız gerekir. SEO ile ilgili birçok teknik vardır. Bu yazıda hepsini öğreneceksiniz…”
Sayfa B
“SEO (Search Engine Optimization), bir web sayfasının arama motorlarındaki organik görünürlüğünü artırma sürecidir. Üç ana katmanı vardır: teknik SEO (crawl, index, hız), içerik SEO (semantik kapsama, intent eşleşmesi) ve otorite SEO (backlink, mention, entity ilişkisi).”
Klasik Google bunlardan birini sıralayabilir.
Ama vector retrieval için fark net.
Sayfa A:
- dolgu yoğun
- bilgi düşük
- anlam dağınık
- chunk’ı retrieve edilse bile cevap üretmiyor
Sayfa B:
- tanım net
- yapı belirgin
- entity ilişkisi açık
- tek chunk bile bağlamsız anlamlı
Reranker’ın hangisini seçeceği belli.
Yaygın Hatalar
Vector retrieval’a hazırlık yaparken en sık görülen hatalar:
1. Girizgâh Şişirme
İçeriğin başına 200 kelimelik “merhaba, bugün şunu anlatacağız” yazmak.
Bu chunk retrieve edilirse hiçbir işe yaramaz.
2. Tanımları Geciktirmek
“Bu kavrama gelmeden önce şunu anlatmalıyım…” mantığı.
LLM’ler tanımı arar. Bulamazsa başka kaynağa gider.
3. Aynı Şeyi Tekrar Etmek
Embedding modelleri tekrarı sever sanılıyor.
Aslında tersi.
Tekrar eden semantik içerik düşük information gain demek.
4. Bağlamı Atlamak
“Bu yöntemin nasıl çalıştığını biliyorsun zaten” demek.
Hayır, retrieve edildiğinde kimse bilmiyor.
Her chunk kendi içinde anlamlı olmalı.
5. Spesifik Olmamak
“Birçok teknik var”, “çeşitli yöntemler bulunuyor” gibi ifadeler reranker tarafından zayıf bulunur.
İsim ver. Örnek ver. Sayı ver.
6. Heading’leri Önemsizleştirmek
H2, H3 yapısı:
- chunking algoritmalarını yönlendirir,
- okuyucu için olduğu kadar makine için de işarettir.
Düz metin bloğu retrieval için kötü.
Bir Sayfayı Retrieval-Ready Hale Getirmek
Pratik kontrol listesi:
Yapı
- Net H1
- Bölüm bölüm H2
- Alt başlıklarda H3
- Kısa paragraflar
- Listelerden faydalanma
İçerik
- Her bölümün açılışında tanım veya iddia
- Her bölümün bağımsız anlam taşıması
- Spesifik isim, örnek, sayı kullanımı
- Jargon ve terim doğru yerde
- Marka, kişi, teknoloji isimleri açıkça geçiyor
Bilgi Yoğunluğu
- Dolgu cümlesi yok
- “Bunu birazdan anlatacağım” yapısı yok
- Tanımlar geciktirilmiyor
- Bir paragraf, bir fikir
Entity Bağı
- Konuyla ilişkili entity’ler net geçiyor
- İlişkiler açıklanıyor
- Eş anlamlı ifadeler kullanılıyor
Format
- Listeler okunaklı
- Kod, örnek, alıntı net
- Tablolar kısa ve anlamlı
- Görseller alt metinli
Ölçüm: Retrieval Suitability Nasıl Test Edilir?
Bu kısım çoğu SEO’cunun bilmediği bir alan.
1. Embedding Similarity Testi
Sayfanı embedding’e çevir.
Hedef sorguları embedding’e çevir.
Cosine similarity’ye bak.
- 0.80 üstü → çok iyi
- 0.65 – 0.80 → iyi
- 0.50 – 0.65 → orta
- 0.50 altı → zayıf
2. Chunk Bazlı Test
İçeriğini 300-500 token’lık parçalara böl.
Her chunk’ı sorguya karşı test et.
Bazı chunk’lar yüksek skor verirken bazıları çok düşük kalabilir.
Düşük skorlu chunk’ları:
- yeniden yaz,
- netleştir,
- daha spesifik hale getir.
3. LLM Citation Testi
ChatGPT, Perplexity, Claude gibi sistemlere hedef sorguyu sor.
Senin sayfan kaynak olarak çıkıyor mu?
Çıkmıyorsa hangi sayfalar çıkıyor?
Onları analiz et:
- yapısı nasıl,
- bilgi yoğunluğu nasıl,
- hangi entity’leri kullanıyor,
- hangi formatları kullanıyor.
4. Reranking Simülasyonu
Open source reranker modelleri var.
Sayfanı + sorguyu reranker’a verip gerçek skorları görmek mümkün.
Bu, klasik SEO’daki rank tracking’in AI versiyonu sayılabilir.
Şimdi En Kritik Kısım
Birçok SEO’cu hâlâ:
- title,
- meta,
- keyword density
seviyesinde.
Ama oyun başka yere geçti.
Kazananlar: AI’nin bilgiyi nasıl çağırdığını anlayanlar olacak.
Çünkü gelecekte sıralama şöyle işleyecek:
“Bu sayfa kaçıncı sırada?” yerine “Bu bilgi modeli bu kaynağı retrieve etmeye değer görüyor mu?”
sorusu önemli olacak.
Ve işte savaş artık burada dönüyor.
Önümüzdeki 12 Ayda Beklenenler
Birkaç eğilim çok netleşiyor:
1. Klasik SERP eriyor
Kullanıcılar artık 10 mavi linke tıklamıyor.
AI cevabını alıp ayrılıyor.
Bu trafik kaybı değil.
Görünürlük türünün değişmesi.
2. Citation görünürlüğü yeni rank
AI cevabında kaynak olarak geçmek
- sırada olmaktan değerli hale geliyor.
3. Entity authority yükseliyor
Bir kişi, marka veya konunun modelin dünya bilgisinde “tanınmış entity” olması artık SEO’nun parçası.
4. Yeni metrikler geliyor
- citation share
- retrieval frequency
- answer presence rate
- entity association score
gibi yeni göstergeler oluşacak.
5. İçerik formatı evrilecek
Kısa cevaplı, tanım yoğun, listelenebilir ve chunk-friendly formatlar uzun girizgâhlı içerikleri ezecek.
Sektörel Uygulama: Hangi Sektör Ne Yapmalı?
Vector retrieval optimizasyonu her sektörde aynı çalışmıyor.
E-ticaret
- Ürün açıklamalarında “ne olduğu + kime uygun + nasıl kullanıldığı” üçlüsü
- Kategori sayfalarında semantik kapsama
- Karşılaştırma içerikleri reranker’da çok güçlü
- “X vs Y” tarzı sayfalar AI alıntılarında öne çıkıyor
B2B / SaaS
- Çözüm odaklı tanım yapısı kritik
- Use case bazlı chunk’lar değerli
- Entity ilişkisi (ürün – sorun – sektör – persona) önemli
- Glossary sayfaları AI sistemlerinde çok sık retrieve ediliyor
Yerel Hizmet
- Şehir + hizmet + niş üçlüsü
- Müşteri sorularına net cevap veren chunk’lar
- “Nasıl yapılır” formatı güçlü
- Coğrafi entity’lerle güçlü ilişkilenme
Yayıncılık / Blog
- Tanım yoğun açılışlar
- Liste ve karşılaştırma formatları
- Spesifik veri ve kaynak referansları
- Otorite işaretleri (yazar, tarih, güncelleme)
Kişisel Marka
- Tutarlı entity tanımı (her sayfada aynı kimlikle anılma)
- Konu-kişi ilişkisinin tekrarı
- “X uzmanı Y” yapısının netliği
- Cross-platform tutarlılık
Sıkça Sorulan Sorular
Vector retrieval klasik SEO’yu öldürür mü?
Hayır. Üzerine bir katman ekliyor.
Klasik SEO sinyalleri (link, hız, mobil uyum) hâlâ çalışıyor.
Üstüne semantik kalite ve retrieval suitability gerekiyor.
Bütün sayfalar uzun mu olmalı?
Hayır. Önemli olan bilgi yoğunluğu.
500 kelimelik net bir tanım sayfası, 4000 kelimelik dağınık yazıdan iyi performans gösterebilir.
Keyword araştırması bitti mi?
Bitmedi. Ama değişti.
Artık keyword değil, intent ve entity araştırması yapılıyor.
Bir keyword’ün arkasındaki kavram ağı çıkarılıyor.
Kaç chunk olmalı?
Bu sayfanın algoritmik bir parçası.
Senin işin: her bölümün kendi başına anlamlı olmasını sağlamak.
Geri kalanı sistem halleder.
AI sistemleri sayfamı nereden öğreniyor?
İki yolla:
- Crawler ile (Bingbot, Googlebot, ChatGPT user agent vs.)
- Sayfan zaten bir veritabanında (Common Crawl gibi) ise oradan
Yani crawl edilebilirlik hâlâ kritik.
Robots.txt ile AI bot’larını engellemek GEO açısından intihar.
Schema markup hâlâ önemli mi?
Evet. Hatta daha önemli.
Çünkü schema:
- entity tipini netleştirir
- ilişkileri formal hale getirir
- makine okunabilirliği artırır
Article, Person, Organization, FAQ, HowTo şemaları modern AI sistemlerinde okunuyor.
Backlink hâlâ değerli mi?
Evet. Ama tek başına değil.
Mention (linksiz anılma) artık link kadar değerli olabilir.
Çünkü entity ilişkisi backlink olmadan da kuruluyor.
İçerikler ne sıklıkla güncellenmeli?
Bilgi değiştiğinde.
Düzenli “küçük rötuş” değil, gerçek bilgi güncellemesi önemli.
Tarihi değiştirmek değil, içeriği iyileştirmek.
Information Gain Nedir?
Bu, AI retrieval’da en az anlaşılan ama en önemli kavramlardan biri.
Tanım
Bir içeriğin, mevcut bilgi havuzuna ne kadar yeni bilgi eklediği.
Google’ın da patentlerinde geçen bir terim.
Neden Kritik?
Çünkü bir konuda 1000 sayfa zaten varsa, 1001. sayfa eğer aynı şeyleri söylüyorsa hiçbir değer taşımıyor.
Reranker bunu fark ediyor.
LLM cevap üretirken “yeni” olanı tercih ediyor.
Information Gain Nasıl Artırılır?
1. Orijinal Veri
Kendi araştırman, kendi ölçümlerin, kendi case study’lerin.
2. Yeni Perspektif
Mevcut bilgiyi farklı bir açıdan ele almak.
3. Sentez
Birden çok kaynağı birleştirip yeni bir model çıkarmak.
4. Spesifik Örnekler
Genel anlatımı değil, sayısal-isimli örnekleri tercih etmek.
5. Karşıt Görüş
Mevcut görüşe argümanlı itiraz değerli.
Information Gain’i Düşük İçerik Belirtileri
- “Şu konu çok önemli, bilmeniz gerekenler…”
- “X şudur, Y şudur, Z şudur” listesi (Wikipedia paraphrase’i)
- Tanım + tanım + tanım yığını
- Hiç sayı, hiç örnek, hiç vaka yok
- Yazar yok, kaynak yok, ölçüm yok
Bu tip içerik retrieve edilse bile reranker tarafından eleniyor.
Information Gain’i Yüksek İçerik
- “X şirketinde 6 ay boyunca Y yöntemini test ettik. Sonuç: Z.”
- “100 kişilik kontrol grubunda şu farkı ölçtük.”
- “Mevcut literatür A diyor, ama bizim bulgumuz B.”
- “X yöntemini denedik, beklediğimiz olmadı, sebebi şu çıktı.”
Bu içerikler AI sistemlerinde çok daha sık alıntılanıyor.
AI Crawler’ları ve Erişilebilirlik
Vector retrieval mantığı içeriğin AI sistemlerine ulaşmasını gerektiriyor.
Bu da modern bir crawl konusu.
AI Bot’ları Kimler?
- GPTBot (OpenAI)
- ChatGPT-User (ChatGPT browsing)
- PerplexityBot
- ClaudeBot
- Claude-Web
- Google-Extended (Gemini için)
- Applebot-Extended
Bu bot’lar:
- sayfa indirir,
- metni çıkartır,
- embedding’e dönüştürür,
- sistemde saklar.
Tipik Hata
Birçok site robots.txt’inde GPTBot’u, ClaudeBot’u, Google-Extended’ı bloklamış durumda.
Sebep genelde:
- telif kaygısı,
- “AI bizim içeriğimizi kullanmasın” anlayışı.
Sorun
Bu engelleme AI cevaplarında görünmemekle sonuçlanıyor.
Yani:
Telif kaygısıyla AI bot’unu kapatan site, AI çıktısında hiç anılmıyor.
Bu trafik kaybı değil, görünürlük kaybı.
Doğru Yaklaşım
- AI bot’larına izin ver
- Sayfaların hızlı yüklensin
- JavaScript’e kritik içerik gömme — bazı bot’lar JS render etmiyor
- Server-side rendering veya hibrit yapı tercih et
- Sitemap’leri güncel tut
- Meta description ve schema’yı zenginleştir
Prompt-Based Test Yöntemleri
İçeriğinin AI sistemlerinde nasıl performans verdiğini ölçmenin pratik yolları var.
Yöntem 1: Doğrudan Sorgu Testi
Hedef sorgunu ChatGPT’ye, Perplexity’ye, Claude’a sor.
Bak:
- Kaynak listesi var mı?
- Senin sayfan listede mi?
- Hangi paragraf alıntılanmış?
- Hangi yapı kullanılmış?
Yöntem 2: Sayfa Bazlı Test
Sayfanın URL’ini doğrudan AI’a ver:
“Bu sayfa neyi anlatıyor, ana iddiası ne, hangi sorulara cevap veriyor?”
AI’nın özetlediği şey senin yazdığını sandığın şeyle örtüşüyor mu?
Eğer örtüşmüyorsa sayfan retrieve edildiğinde yanlış cevap üretebilir.
Yöntem 3: Karşılaştırma Testi
AI’a şunu sor:
“[Senin sayfan] ve [rakip sayfa] arasında hangisini daha güvenilir bir kaynak olarak önerirsin? Neden?”
Cevabın gerekçesi sayfan hakkında çok şey söyler.
Yöntem 4: Chunk Testi
Sayfanın bir paragrafını alıp şunu sor:
“Bu metin tek başına şu soruya cevap veriyor mu: [hedef sorgu]?”
Eğer cevap “evet, açıkça” değilse o chunk retrieval’da zayıf demektir.
Yöntem 5: Boşluk Testi
“[Konu] hakkında en sık eksik bırakılan bilgi nedir?”
AI’nın söylediği boşluğu sayfanda doldurursan information gain artar.
Uzun Vadeli Strateji
Vector retrieval optimizasyonu tek seferlik bir iş değil.
Aşamalı bir kültürel dönüşüm.
Birinci Aşama: Audit
Mevcut içeriklerinin tamamı için:
- embedding similarity skoru
- chunk kalitesi
- entity netliği
- information gain
ölçülmeli.
Zayıf sayfalar listelenmeli.
İkinci Aşama: Restorasyon
Mevcut içerikler:
- girizgâhlardan temizlenir
- tanımlar öne çekilir
- chunk-friendly hale getirilir
- entity ilişkileri güçlendirilir
Üçüncü Aşama: Genişleme
Information gain’i yüksek yeni içerikler üretilir:
- orijinal araştırma
- case study
- karşılaştırma
- sentez içerikleri
Dördüncü Aşama: İzleme
AI çıktılarında görünürlük takip edilir:
- citation share
- answer presence
- mention frequency
- retrieval consistency
Beşinci Aşama: Sürekli İyileştirme
Yeni modeller geldikçe, algoritmalar değiştikçe ölçüm ve iyileştirme döngüsü devam eder.
Tıpkı klasik SEO gibi.
Tek fark: artık savaş kelime üzerinden değil, anlam üzerinden dönüyor.
Özet
Vector retrieval şu üç şeyi anlamak demek:
1. AI metni anlam olarak okur, kelime olarak değil
Bu yüzden semantik kapsama keyword’den önemli.
2. İçerik parçalanarak çağırılır
Bu yüzden her bölümün kendi başına anlamlı ve bağlamlı olması şart.
3. Modelin “alıntılanabilir” bulduğu içerik kazanır
Bu yüzden net tanım, spesifik bilgi, açık entity ilişkisi yeni rank faktörleri.
GEO, SEO’nun yerini almıyor.
SEO’nun bir üst katmanı oluyor.
Klasik SEO’yu bilen, ama vector retrieval mantığını da kavrayan profesyoneller önümüzdeki dönemin asıl kazananları olacak.
Çünkü kelime savaşı bitti.
Anlam savaşı başladı.
Son Söz: Bu İşin Felsefesi
Vector retrieval’ı teknik bir konu olarak görmek en büyük yanılgı.
Aslında bu konu bilgi paylaşımının doğasıyla ilgili.
Eski sistem şunu ödüllendiriyordu:
“Doğru kelimeleri doğru sayıda kullan.”
Yeni sistem ise şunu ödüllendiriyor:
“Gerçekten bir şey biliyor musun, bilmiyor musun?”
Bu yüzden:
- dolgu cümlesi yazan içerik üreticileri zorlanacak,
- bir konuyu derinden anlayan yazarlar öne çıkacak,
- yapay yöntemlerle “SEO yapan” siteler eriyecek,
- gerçek otorite sahibi kaynaklar büyüyecek.
Bir bakıma, internet ilk defa “bilgiyi” gerçekten ödüllendirmeye başlıyor.
Klasik SEO bunu vaat etmişti ama tutamadı.
Çünkü kelime sayma mantığı manipüle edilebilirdi.
Anlam ölçme mantığı çok daha zor manipüle ediliyor.
Bu, içerik üreticileri için büyük bir fırsat.
Çünkü artık:
- uzun değil, yoğun
- gösterişli değil, net
- viral değil, kaynak
olan içerik kazanıyor.
Ve eğer gerçekten bir alanda derinleşmişsen, gerçekten yeni bir şey söyleyebiliyorsan, AI sistemleri bunu fark ediyor.
Çünkü onlar da bilgiyi arıyor.
Tıpkı insanlar gibi.
Kapanış
Bu yazıda gördüklerimizi tek paragrafta toplarsak:
Vector retrieval, AI sistemlerinin içeriği kelime değil anlam üzerinden okuduğu, bir embedding modeliyle metni matematiksel uzaya yerleştirip cosine similarity gibi yöntemlerle yakınlık ölçtüğü, chunk bazında parçalayıp reranker’la yeniden sıraladığı ve LLM’in context window’una en güçlü 3-5 parçayı verdiği modern bilgi erişim mantığıdır. SEO bu mantığa göre yeniden yapılandığında entity netliği, semantik kapsama, information gain, chunk-friendly format ve AI crawler erişilebilirliği yeni rank faktörleri haline gelmektedir. GEO, bu yeni dünyada içerikleri retrieval-ready hale getirme disiplinidir ve klasik SEO’nun yerini almak yerine üzerine bir üst katman ekler.
Bu mantığı kavrayan içerik üreticileri, önümüzdeki dönemde “bulunabilir” değil, alıntılanabilir olacak.
Ve fark tam burada.
Author Profile
Latest entries
GEOMayıs 27, 2026Yapay Zeka SEO Uzmanı Seçerken Nelere Dikkat Edilmelidir?
GEOMayıs 19, 2026ChatGPT’de Çıkmayan Markalar İçin GEO Gerçeği: 2026’da Görünmez Kalmamak İçin Bilmeniz Gerekenler
TOOLSMayıs 19, 2026Bing Webmaster Tools Kullanım Kılavuzu
GEOMayıs 17, 2026Generative Engine Optimization ile Discoverability Artırma




Write your comment