Pri opisu evolucijske prošlosti gena, homolozima zovemo one gene koji imaju zajedničko porijeklo. Detaljniji opis para gena moguć je kroz pojmove ortolozi za one koji su homologe koji su nastali specijacijom (razdvajanjem vrsta) i paralozi za one homologe koji su odvojeni događajem duplikacije.
Kako su ti izrazi definirani u svjetlu filogenetskog stabla, stroga definicija zahtjeva poznavanje filogenetskih odnosa između organizama prije zaključivanja o ortološkim i paraloškim odnosima. U strogom smislu, ti odnosi mogu se opisati samo za par gena. S obzirom na to da je izgradnja filogenetskih stabala nije trivijalna, postoje brojne metode koje se temelje na korištenju homologije sekvenci (bez oslanjanja na filogenetsko stablo) za definiranje ortoloških i paraloških odnosa. S obzirom na činjenicu da se fokusiramo na prokariotske organizme koji nemaju u potpunosti opisane filogenetske odnose (zbog velike količine horizontalnog prijenosa gena), u našem radu fokusiramo se na ove metode. Također, dostupno grupiranje parova ortologa u OMA grupe bit će korisno kada budemo konstruirali naše multi-genomske skupove podataka.
OMA algoritam je metoda pronalaženja ortologa temeljena na homologiji sekvenci koja uzima u obzir događaje gubitka gena: obostrano snažni pogodci (engl. bidirectional strong hits) - obostrano najbolji pogodci unutar intervala pouzdanosti (engl. bidirectional best hits, within a confidence interval) - iz dvije vrste se prekidaju kada je postoji treći organizam (“svjedok ne-ortologije”) koji sadrži par proteina sličniji pojedinim proteinima u paru nego što su pronađeni obostrani pogodci slični jedan drugome. Parovi za koje je pronađen svjedok ne-ortologije nazivaju se “slomljenim parovima”, tj. paralozima; preostali parovi (pravi ortolozi) se koriste u formiranju OMA grupe. Ova baza sadrži velik broj sekvenciranih organizama, redovno se ažurira i dostupna je sa adrese http://omabrowser.org/.