Na čistenie dát sme využili Open Refine, kde sme nahrali náš Excel súbor. V tomto programe sme využili mnoho funkcií, ale mne sa najviac páčilo klastrovanie. Klastrovanie kľúčových slov ušetrí pri SEO analýze veľa práce a hlavne času. Táto funkcia jednoducho prepíše podobné slová na jedno. Najlepšie to vysvetlím na príklade, ja som vyhľadávala všetko o gumičkách do vlasov.
Mali by sme klastrovať kľúčové slová, ktoré sú:
– rozdielne len v poradí slov (vlasová gumička, gumička vlasová)
– rozdielne v diakritike (gumička, gumicka)
– rozdielne v singulári alebo pluráli (gumička, gumičky)
Takto to vyzerá celkom jednoducho, ale následne sme museli klastrovaným výrazom pripočítať dáta o hľadanosti a využiť mnoho iných funkcií v Open Refine. Open Refine sme využili aj na zmazanie duplicitných slov, nerelevantných výrazov a klasifikáciu kľúčových slov. V skratke vám poviem, že zorientovať sa a naučiť sa všetky Open Refine triky by mi trvalo naozaj veľmi dlho. Na kurze sa síce namakáte, ale naučíte sa mnoho zlepšovákov a trikov, ktoré by vám samým trvali možno aj mesiace.