Да ли Гугл заиста фаворизује латиницу у односу на ћирилицу?
Кратак одговор: НЕ
У српској интернет заједници постоји уврежено уверење да Гугл у претрагама боље рангира сајтове на латиници, него на ћирилици.
Ово уверење није засновано на конкретним чињеницама које се односе на рад Гуглових алгоритама претраге, већ више на неком „нејасном осећају“ и „колективном искуству“ да Гугл ипак више фаворизује латиничке сајтове на уштрб ћириличких.
Управо ова заблуда, јер ово уверење јесте заблуда, кочи развој и већу заступљеност ћириличких сајтова на rs домену.
✤
Но, да ипак будемо објективни, свако је могао приметити да када откуца термине ћирилицом, у резултатима претраге ће се појавити и латинички сајтови. Можда чак и у већем броју од ћириличких.
О чему је онда заправо реч? - Није реч о Гугловом фаворизовању латинице (нити било ког другог писма посебно), већ о последици већинског понашања корисника на мрежи (интернету) који често користе латиницу и тиме дају смернице Гуглу како да формира резултате претраге.
Реч је о социјално индукованим сигналима које Гугл онда користи да угради у свој софистицирани алгоритам претраге.
Неутралност по питању писма
Гуглов систем за рангирање резултата претраге је неутралан и агностичан по питању писма.
У савременој интернет технологији, латиница и ћирилица су део истог Уникод стандарда записа текста (или „Јуникод“ у енглеском изговору) који сваком знаку (слову) додељује јединствени број.
Коришћењем овог универзалног и званично важећег стандарда сва писма су равноправно заступљена и ниједно писмо нема привилегованији положај у односу на друга.
Пошто Гугл (и скоро сви сајтови на свету) користи Уникод стандард, самим тим је почетна претпоставка о системски уграђеном фаворизовању латинице неутемељена.
Једина предност коју латиница у овом стандарду има, је та што заузима ниже бројеве па је за њен пренос преко мреже потребно мање бајтова. Али та чињеница не утиче на алгоритам рангирања и у условима брзог интернета је генерално занемарљива.
Фактори који утичу на рангирање сајтова
Сада када знамо да не постоји уграђено системско преферирање писма захваљујући примени Уникод стандарда, погледајмо који фактори заиста утичу на рангирање сајта у резултатима претраге:
- релевантност садржаја сајта за конкретну претрагу,
- квалитет садржаја сајта у смислу читљивости и пружања адекватних информација,
- број веза (линкова) са других сајтова који воде до дотичног сајта,
- репутација и самих тих других сајтова који имају везе ка дотичном сајту,
- технички квалитет сајта у смислу колико се сајт брзо учитава, да ли су елементи на сајту визуелно стабилни или „поскакују“,
- оптимизованост сајта за претрагу у смислу исправне структуре странице и адекватног навођења кључних речи које су се користиле у претрази (енгл. Search Engine Optimization - SEO),
- корисничко искуство које се мери временом које корисник проведе на страници и степеном његове ангажованости на истој (број кликова, скроловања и сл.),
- задовољство корисника сервираним резултатима претраге (кроз проценат кликтања на везе до сајтова у резултатима претраге).
Само писмо које се употребљава: ћирилица или латиница, не представља фактор у рангирању.
Речено техничким жаргоном: на оптимизованост сајта за претрагу (енгл. Search Engine Optimization - SEO) не утиче писмо и потпуно је свеједно да ли користите латиницу или ћирилицу.
Равноправно индексирање оба писма
Гугл препознаје да се српски језик може писати на оба писма те ћириличке и латиничке сајтове једнако индексира, без разлике.
Под индексирањем се подразумева процес читања садржаја сајта и његовог похрањивања у базу ради претраге.
Гугл као и остали претраживачи попут Бинга, Јандекса или Првог ћириличког претраживача - Дурбина, „токенизују“ текстуални садржај сајта, тј. деле га на речи (токене) и за сваку реч бележе на којим се све страницама сајта та реч појављује.
Ова техника се зове инверзни индекс и одавно се примењује у писаној стручној литератури где се на крају књига може наћи индекс са списком свих термина и бројевима страница где се они помињу.
Индекси за сваки сајт понаособ се онда комбинују у један велики глобални индекс термина и линкова до страница.
Претрага ради тако да када откуцате неки термин, Гугл у свом индексу тражи све сајтове на којима се термин помиње, затим врши рангирање сајтова према њиховој релевантности за тражени термин и на крају, сервира резултате кориснику. - То је у суштини основни принцип рада претраге, објашњен на врло поједностављен начин.
Нормализација писма
Али ово објашњење није довољно да објасни појаву другог писма у резултатима претраге, нпр. појаву латиничких сајтова за претрагу откуцану ћирилицом, као и обрнуто.
Треба нагласити да Гугл исту реч на српском језику, али написану на ћирилици и латиници, посматра као две одвојене речи, тако да оне не деле исти индекс, тј. списак линкова до сајтова где се те речи помињу.
Иста реч написана на ћирилици ће се наћи на ћириличким сајтовима, док ће се њена латиничка верзија наћи на латиничким. То су најчешће два потпуно одвојена скупа сајтова.
Гугл ипак ради нешто што се зове „нормализација писма“ у смислу да разуме да је иста реч у питању без обзира на писмо и да комбинује ћириличке и латиничке сајтове у резултатима претраге.
Зато у резултатима видимо измешане сајтове на ћирилици и латиници.
„Зачарани круг“
Али зашто онда корисници ипак доживљавају да се латиница боље рангира? - То уверење се ствара на основу индиректних ефеката који немају везе са Гугловим преференцијама према одређеном писму, које и не постоје.
Ти индиректни ефекти су највећма социјалног карактера.
Наиме, корисници на мрежи из разноразних разлога у које нећемо овде улазити, углавном куцају латиницом.
То за последицу може да има да ти корисници и очекују латиничке резултате по инерцији куцања и да се онда, у нешто већем проценту, и одлучују да кликну на латинички реултат.
Временом, тај нешто већи проценат кликтања може да има кумулативни ефекат и постане сигнал Гугловом алгоритму да треба да појача ранг неких латиничких резултата.
То опет по принципу „повратне спреге“ ствара утисак да се латиница боље котира што даље подстиче кориснике да је још више користе. - Тако се ствара се ефекат „зачараног круга“ у коме образац понашања сам себе подстиче.
ЗАКЉУЧАК
Значи, фаворизовање латинице није уграђено у Гуглов алгоритам претраге као такво, већ је већа заступљеност латинице у резултатима претраге последица колективне навике да се у дигиталној сфери више користи латиница.
Гугл само прати већинско понашање корисника на мрежи и подешава свој алгоритам како би максимизовао учинак, а што за последицу доводи до процентуално веће заступљености латинице.
Када би већинско понашање корисника на мрежи било такво да преферира ћирилицу, сасвим је извесно да би корисници стекли утисак да Гугл сада фаворизује ћирилицу.
Ћирилица је подеснија за претрагу
Оно што је иронично у целој овој причи јесте то да је ћирилица у ствари подесније писмо за претрагу од латинице и то из следећих разлога:
- Ћирилица је једнозначна: у ћирилици се не користе двознаци за нека слова као у латиници, попут: LJ, NJ, DŽ или Lj, Nj, Dž.
- Не постоји ошишана или ћелава ћирилица за разлику од латинице (C за Č и Ć, DJ за Đ, S за Š, Z за Ž). Коришћењем „ћелаве латинице“ уноси се непотребан шум и смањује тачност претраге.
- Ћирилица је прецизнија: „инјекција“ није „ињекција“, што се код латинице не може разлучити када се напише: „injekcija“. Ово је само један од примера.
Порука ауторима сајтова
Драге колеге,
као аутор два ћириличка сајта:
- Ћирилизатора и
- Првог ћириличког претраживача - Дурбина,
могу да потврдим да моји сајтови нису имали никаквих проблема са индексирањем нити са видљивошћу у резултатима претраге. Чак су почели врло брзо да се појављују у претрагама и то на првој страници.
Никакви пенали нити „спутавања“ нису постојала због тога што су сајтови на ћирилици. Штавише, поједине странице на ћирилици су биле боље рангиране у претрагама од својих верзија на латиници (нпр. страница за текстуалне алате, попут: пресловљавања).
Не постоји никаква бојазан да ћете имати мање читалаца само зато што вам је сајт на ћирилици.
Оно што јесте битно је да се постарате да садржај и техничке перформансе вашег сајта буду квалитетни и на задовољавајућем нивоу, и корисници ће сами кренути да пристижу.
Ово вам говори инжењер са преко 20 година активног бављења рачунарством и информационим технологијама.
Радо ћу свакоме од вас помоћи својим саветима и искуством, ко има жељу да пређе на ћирилицу или макар уведе ћирилицу као друго писмо на свом сајту.
Једина накнада за то ће ми бити задовољство да нови ћирилички сајт „угледа светло дана“.
Желим вам свако добро и пуно успеха у раду.
Дејан Илић, дипл. инж. електротехнике.
info[et]cirilizator.com
![]()
Ћирилизатор препоручује:
Први ћирилички претраживач: Дурбин
„Српски Гугл“ са више од 36.000 страница са преко
5.000 ћириличких сајтова.
Запратите нашу Фејсбук страницу где објављујемо најзанимљивије сајтове на ћирилици:
Ћирилизатор наЋирилизатор подсећа:
Погледајте и наше друге текстуалне алате:
Пресловљавање писма: латиница у ћирилицу и ћирилица у латиницу
Š ⇄ ШПретворите мала у ВЕЛИКА слова и друге промене:
абв ⇄ АБВСортирајте текст по алфабету (тј. абецеди):
абв ↑↓ вбаЋирилички сајтови на:
.rs доменуЋирилички сајтови на:
.срб доменуЋирилички сајтови на:
.me доменуЋирилички сајтови на:
.ba доменуЋирилички сајтови на:
.hr доменуЋирилизаторове мозгалице:
Вежбај слагалицу и победи на чувеном квизу 🏆
Решење слагалицеРешите анаграме од 10 слова:
Анаграми од 10 слова