A látens homológia és a konvergens szabályozási fejlődés az élesztők ismételt megjelenésének alapja

Genetikai mátrix stratégia bináris opciók áttekintéséhez.

Az élesztőgombák számos gombás lábban kialakultak, de evolúciós eredetük genetikai okai és következményei ismeretlenek. Itt megmutatjuk, hogy az élesztőformák kifejlesztésének lehetősége a gombás evolúció korai szakaszában felmerült, és önmagában több uralomban dominánsá vált, valószínűleg a Zn-klaszter transzkripciós faktorok párhuzamos diverzifikációjával, amely egy gombaspecifikus család, amely részt vesz az élesztő-fonalas kapcsolások szabályozásában.

Eredményeink azt sugallják, hogy a konvergens evolúció megtörténhet egy konzervált genetikai eszközkészlet ismételt telepítésével, ugyanazon funkció érdekében, különálló kladekban, a szabályozási evolúció révén.

Arra utalunk, hogy ez a mechanizmus az evolúciós konvergencia általános forrása lehet még nagy időarányban is. Bevezetés A hasonló fenotípusos tulajdonságok ismételt fejlődése a különféle kladeokban az 1. A javasolt mechanizmusok között szerepel a konvergens molekuláris evolúció a nukleotid vagy aminosav szekvencia szintjén, hasonló 2, 3, 4, 5 szelekciós nyomás eredményeként.

A kódoló szekvenciák párhuzamos változásaival, amelyek funkcionálisan ekvivalens genetikai eszközkészletekhez nyereséges kereskedési jelek, rendkívül alacsony a valószínűsége, és nem valószínű, hogy magyarázzák a konvergencia átható jelenségét.

Az élesztők polifületikus egységet alkotnak, amely a gombák több, egymástól távoli rokonában keletkezik, és magában foglalja azokat a fajokat, amelyek életciklusuk egészét vagy nagy részét egysejtű formában töltik.

genetikai mátrix stratégia bináris opciók áttekintéséhez

Az élesztőn növekedni képes fajok közé tartozik a klinikailag és biotechnológiai szempontból legfontosabb gombák, és megtalálhatók a legtöbb fő gombás vonalban, mint például Ascomycota például Saccharomyces cerevisiae, Schizosaccharomyces pombe és Basidiomycota Cryptococcus neoformans, Malassezia globosade a korábban eltérő Mucoromycotina vagy származtatott csoportokban is, mint például a Pezizomycotina fekete élesztője.

Fontos szempont, hogy több, túlnyomórészt élesztőszerű formájú faj képes fonalas növekedést megmutatni, és több, elsősorban fonalas gombás képes bizonyos körülmények között élesztőként növekedni dimorf gombák 8, 9. Az egysejtű élesztőszerű fajokat tartalmazó vonalokat tíz-száz millió millió év választja el egymástól 10, ám ezek figyelemre méltó fenotípusos és metabolikus hasonlóságokat mutatnak.

Az élesztők konvergens evolúcióját lehetővé tevő genetikai újítások, valamint eredetük evolúciós következményeinek kiértékelése céljából összehasonlítottuk a rostos, dimorf és élesztőképző gombák 59 genomját. Kifejlesztettünk egy számítógépes csővezetéket lásd: Módszerek az ortológ gének orto-csoportok összes csoportjának azonosításához és a gén-duplikációk és veszteségek feltérképezéséhez a szervezeti filogenezisben a Dollo parsimonony segítségével. Ezután dúsítási analízist végezzünk, hogy azonosítsuk a szignifikánsan túlzottan alulreprezentált csoportokat a glikoplikációk és veszteségek között a filogenia egyes interodejai mentén, és ezeket összekapcsoljuk az élesztőformák evolúciójával az ősi állapot rekonstrukcióval lásd az Analitikai részletek módszerét.

genetikai mátrix stratégia bináris opciók áttekintéséhez

Eredményeink arra utalnak, hogy az élesztő növekedésének lehetősége a gombás evolúció korai szakaszában fejlődött ki, és a gombák többségében megőrződött.

Az élesztő-stílusú életmódra való áttérés azonban sokkal később következett be az élesztőnövekedés genetikai eszközkészletének szabályozási mechanizmusában bekövetkező változások révén, amelyek arra utalnak, hogy az élesztőfenotípus konvergens evolúciója a fejlődési potenciál egyetlen eredetén keresztül következett be, amelyet a annak szabályozása.

Például azt a következtetést vontuk le, hogy a gombák utolsó egyetemes általános őse gén-orto-csoporttal rendelkezik, a magas duplikációs arány és a mérsékelt génveszteség periódusát követően Kiegészítő 1. A filogenezis egy génből álló particionált adatkészletből származik, és kilenc kivételével mind a csomóponton maximális ML bootstrap támogatást nyújt.

A kiemelt kék út az élesztőszerű növekedés potenciáljának evolúciós eredetét és filogenetikai eloszlását mutatja. A kék színű fajok élesztőként képesek növekedni dimorf gombákmíg a nagyobb betűtípus azt jelzi, hogy a fajok életciklusuk nagy részét élesztő formájában töltik.

A kék és a fehér sávok az élesztő citokinezisében részt vevő gének fejlődését és veszteségét mutatják. Az oszlopok mutatják a génduplikáció és -vesztés mértékét az öt élesztőszerű klánban, normalizálva a fa egységágának hosszával. Teljes méretű kép Az élesztőszerű növekedés eredete rekonstruálása Az élesztőszerű növekedés eredetét a maximális valószínűség ML 11 felhasználásával rekonstruáltuk egy fafa gyűjteményéből, amelyet egy bayes-i Markov-lánc Monte Carlo filogenómiai elemzésének 12 hátsó eloszlásából vett mintából vettünk, amely — egypéldányos gént tartalmaz kiegészítő 4.

Az ősi állapotok rekonstrukciói az élesztőszerű növekedés potenciálját a Mucoromycotina és Dikarya egyesítő csomópontnál hozták létre 1. A csomóból származnak a chs2pchs3p és cts1p S. Ezért valószínű, hogy a duplikációk, amelyeket ebben a csomópontban megfigyeltünk, olyan párbeszédeket hoztak, amelyeket az evolúció során az élesztőszerű gombák citokinézisére adaptáltak.

  1. Különböző példák mutatják be a csomagfunkciók hatékony használatát.
  2. Reális-e pénzt keresni a bitcoinokon?

Az élesztő primer septum szintézisében és lebontásában részt vevő egyéb fehérjék szintén megjelentek a gombák evolúciójának korai szakaszában. Az Eng1paz endo-1, 3-β-glükanázt lebontó β-glükánok az anya- és a lánysejtek között a hasadékban és a kezdő élesztőben 13, egy gombaspecifikus ortogrupció tagja, amely az Entomophthoromycotina, Mucoromycotina és Dikarya egyesítő csomópontjából származik. Megjelent az agn1p-t α-glükanáz, amely feloldja az anyasejt falát a szeptum széle körüla chs1p-t kitin-szintáz, amely kitint épít az elsődleges szeparációban és a mok1p-t α-glükán-szintáz, amely építi az α-glükánt az elsődleges szeptemberben tartalmazó ortocsoportok az élesztőszerű növekedés kialakulását közvetlenül követő csomópontban 1a.

Összefoglalva, ezek az eredmények azt sugallják, hogy az élesztősejtek elválasztásában beleértve a primer septum szintézisét és lebontását részt vevő gének a rostos ősökben a gombás fejlődés korai szakaszában megjelentek, és a gombafa egészében megőrződtek. A sejtfal lebomlása előtt a sejtosztódásban részt vevő gének például az aktomiozin-gyűrű komponensei, septinok, Bud- fehérjék 17 alkotják az eukarióta sejtosztódási programot, és így ősibb eredetűek az egysejtű chytrids és a mikrosporidia által használt.

Ezért azt javasoljuk, genetikai mátrix stratégia bináris opciók áttekintéséhez az élesztőszerű növekedés genetikai eszközkészletét hozzáadják az eukarióta sejtosztási program tetejére a gombás evolúció korai szakaszában, és széles körben megőrizték a gombás evolúció során.

Ez a megállapítás magyarázza az élesztők és a dimorf gombák elterjedt előfordulását, amelyek figyelemre méltóan hasonló élesztőfázisokkal rendelkeznek a filogenetikailag különböző gombacsoportok között.

Az élesztő evolúciójának genomiális következményei Ezután azt vizsgáltuk, hogy az élesztők hogyan váltak önállóan domináns formává számos távoli rokonban. Ortocsoportokat azonosítottunk, amelyek öt, elsősorban élesztőszerű formákat tartalmazó kládban származnak, vagy veszteségeket mutatnak, beleértve a Saccharomycotina, Taphrinomycotina, Tremellomycetes, a Pucciniomycetes és Ustilaginomycetes részeit 1a — d ábra.

Minimális genomi innovációt vontunk le egy kládonként — másolatot isám hatalmas génveszteségeket vonunk le.

A Matlab csomag alapvető funkciói

Az élesztő-szerű clades-okból származó orto-csoportok funkcionális megjegyzése kismértékű átfedést mutatott az egyes cladekről következtetett genetikai újítások között, ami arra enged következtetni, hogy az egyes élesztő clades adaptációk többnyire vonal-specifikusak 1. Megállapítottuk, hogy ezek a GO kifejezések szignifikánsan felülreprezentáltak néhány más csomópont dubletései között is, elsősorban a dimorf gombákban és néhány másban lásd a kiegészítő információt.

A Zn-klaszter TF-ek a Zn-finger TF családhoz tartoznak, és számos folyamatot szabályoznak, beleértve az élesztő és a fonalas formák közötti váltást több dimorf gombában 18, Lényeges, hogy az Ace2az Eng1 és Agn1 Ezért valószínű, hogy ennek a TF családnak a párhuzamos diverzifikációja megegyezik az egysejtű élettartam fenntartását szabályozó szabályozási repertoár kidolgozásával, és átvált a rostos és az élesztő formák között. Az élesztők életciklusuk nagy részében fenntartják az egysejtű formát, míg rostos formájuk kevésbé domináns szemben a rostos és dimorf gombákkal 6, 8, 9.

A Zn-klaszter TF korábban bejelentett szerepe alapján feltételezzük, hogy ennek a géncsaládnak az expanziója hozzájárul a rostos formák elfojtásához az életciklus során és különböző körülmények között. Ennek alátámasztására azt találták, hogy a Zn-kötő fehérjecsaládok beleértve a Zn-klaszter TF-eket függetlenül terjeszkedtek a Paracoccidioides immitis-ben is, egy másik dimorf 23 gombában, amelynek jól fejlett élesztőfázisa van.

Teljes méretű tábla A Zn-klaszter TF-n kívül alig létezik olyan funkcionális géncsoport, amely duplikációt hajt végre több élesztőkládban; a legtöbb újítás vonal-specifikus például a flokkulinok Saccharomycotinában, 1.

Nevezetesen, a triglicerid lipázok PFamelyek a patogenitásban szerepet játszanak mind a Candida ascita, mind a Malassezia 24 basidiomycetában, egymástól függetlenül kiszélesedtek a Saccharomycotinában amely tartalmazza például a Candida spp.

És a Puccini. A génduplációkkal szemben a génveszteségek az átfedések magas szintjét mutatják az élesztőfajtákban.

Kódonként — génveszteséget rekonstruáltunk 1a. Ábraamelyre vonatkozóan a funkcionális megjegyzés GO kifejezést tárt fel, amelyek mind az öt kládban felülreprezentáltak, és további G4 kifejezést reprezentáltak négy kládban 1b ábra.

Matlab számtani műveletek

A cellulóz- és a lignocellulóz-bomlásban részt vevő gének, beleértve a citokróm p és a glutation-transzferáz géneket, valószínűsége valószínűleg azt tükrözi, hogy az élesztőszerű gombákban nem állnak rendelkezésre fapusztító képességek 6. Eredményeink azt is mutatják, hogy az élesztő-szerű életmódra való áttérés a hidrofóbok teljes veszteségét idézi elő kivéve az Ustilaginomycetes-etamelyek hidrofób tulajdonságokat adnak a sejtfelületekre, és amelyek szerepet játszanak a hyphae vizes és légi fázisai közötti váltásban és a gyümölcs fejlődésében.

A várakozások szerint a veszteségek azaz nem diszpenzibilis között jelentősen alulreprezentált génosztályok magukban foglalják az alapvető celluláris folyamatokhoz, például a DNS replikációhoz, szekvencia felismeréshez, kromatin-kötéshez, kromoszóma szegregációhoz szükséges osztályokat lásd a kiegészítő adatokat.

Nevezetesen, a TF-k, valamint az intracelluláris és extracelluláris transzporttal kapcsolatos gének nem mutatnak jelentős veszteségeket, és nélkülözhetetlenek az élesztők számára, amelyek tükrözik a többsejtű növekedésben és a táplálkozási képességben részt vevő gének megőrzését. Vita Az élesztő-szerű növekedés genetikai eszközkészletének megfigyelt mintája távoli rokonokban, a szabályozási mechanizmus független változtatása révén, ellentmond a konvergens evolúció klasszikus modelljeinek, 1, 3, 26, Vizsgálataink szerint ez a mechanizmus a fenotípus szintjén konvergens evolúció szignatúrákat generálhat, miközben a mögöttes effektorgének csak egyszer fejlődtek ki, és a fenotípus tekintetében nem voltak kifejtve valószínűleg részt vesznek más folyamatokban.

Inkább a konvergenciát figyelték meg szabályozásukban, amely az élesztő jellegű fejlődésének ismételt megjelenését eredményezte az életciklus domináns fázisaként a filogenetikailag távoli lábakban 2.

Javasolták, hogy a 28, 29, 30 latens homológiák például fejlõdõ modulok, szabályozó áramkörök vagy gének támaszkodhassanak a hasonló jellemzõk ismételt eredetére a távoli kládokban, ha ezeket könnyen fel lehet venni ugyanazon új funkció elérésére. Az ilyen rejtett homológiákat azonban szelekció alatt kell tartani, és hatalmas időtartamon, ebben az esetben százmillió év alatt kell fenntartani. Ezért feltételezzük, hogy az ilyen rejtett homológiák alapját képező struktúrák pleiotropok magyarázatot adnak azok fenntartásáraés hogy egyszerű szabályozásmódosítások vezethetnek ahhoz, hogy ugyanazt az új funkciót ismételten alkalmazzák a különféle kládokban.

genetikai mátrix stratégia bináris opciók áttekintéséhez

A látens homológiák tehát megmagyarázhatják a hasonlóság ismételt megjelenését azáltal, hogy hajlamosak a vonalak kialakulására bizonyos fenotípusok kialakulásához, anélkül, hogy ekvivalens genetikai eszközkészletek párhuzamos evolúciójára lenne szükség, és közös életforrás lehet a komplex fenotípusos tulajdonságok konvergenciájának az egész életfában. Az élesztőszerû növekedés kék kör genetikai eszköztára korán fejlõdött, de latens maradt genetikai mátrix stratégia bináris opciók áttekintéséhez különféle funkciókban részt vesz.

Ezt követően a genetikai eszközkészletet új funkciókra telepítették a szabályozás egyszerű megváltoztatásával fekete téglalap.

Ez úgy érhető el, hogy a bemeneti genomokban a géndupláció és -vesztés előzményeinek rekonstruálásával összefüggésben az érdeklődésre számot tartó fenotípusos tulajdonsággal, valamint a tulajdonsággal korrelációban kialakuló ortocsoportok kiszűrésével. Az ilyen ortogrupmokba várhatóan beletartoznak a tulajdonság kialakításában részt vevők, így a COMPARE kiterjedt transzkriptikai erőforrások vagy mechanisztikus adatok hiányában meg tudja deríteni a fenotípusos tulajdonság genetikai hátterét.

A látens homológia és a konvergens szabályozási fejlődés az élesztők ismételt megjelenésének alapja

A csővezeték több egész genomon vagy egy géncsalád egy részén futtatható. A COMPARE jól teljesít nagy multigén családokon, bonyolult sokszorosítással és veszteséggel szimulációs tanulmányok mutatják, nem publikált eredmények.

Ugyanezen probléma korábbi megközelítései alapján az ortogruppokat a kölcsönös legjobb BLAST találatok vagy genetikai távolságok alapján azonosították, amelyek kifejezetten nem modellezik a párhuzamos és specifikációs eseményeket, ezáltal elmulasztják a funkcionalitás vertikális öröklődési mintáinak begyűjtését a specifikáció és a neo- vagy másodlagos eseményeket követő alfunkciók 31, Fehérje-csoportosulás, összehangolás és génfa-következtetések A becsült fehérje szekvenciákat a hasonlóság alapján csoportosítottuk a hasonlóság alapján az MCL A csoportosulás a JGI vezetékét használta.

Az 59 bemeneti genomban összesen fehérje csoportosulása klasztert eredményez, átlagos klasztermennyiség 9, 28 fehérje szingulett kivéve. A legnagyobb klaszter fehérje szekvenciát tartalmazott, míg klaszter volt csak egyetlen fehérjéből. A potenciális génbecslési hibák konzervatív módjaként a további elemzésekből kizártuk azokat az proteineket, amelyek nem mutatnak hasonlóságot más fehérje-szekvenciával az ön-találatokat nem vettük figyelembe az NCBI adatbázisban.

Valószínű, hogy ezzel a szigorú kritériummal kizárunk néhány pontosan előre jelzett fehérjét is, azonban ez valószínűleg nem befolyásolja az eredményeinket, mivel az egyszálú fajspecifikus fehérjék jelentéktelen szerepet játszottak elemzéseinkben. Kimutatták, hogy az MCL-klaszterek jól megfelelnek a 33 géncsaládoknak, így a továbbiakban a klasztert és a géncsaládot felcserélhetően használjuk. Noha az MCL-ről kimutatták, hogy nagy pontosságot ért el a géncsaládok rekonstruálásában, a géncsaládok csak a hasonlóság alapján történő elhatárolása kihívást jelent és többek között az inflációs paraméter szubjektív megválasztásától függ.

A COMPARE számára a klaszterezés kritikus szempontja az, hogy ugyanazon klaszterekben levonjuk a fehérjék monofil csoportjait - másodlagos jelentőséggel bírnak-e azok a klaszterek pontosan géncsaládot képviselnek-e vagy sem, mivel a klaszterek ortogrupmokra oszlanak, amelyek képezik a elemzéseket.

Az RAxML alapértelmezett beállításokkal indult. Mivel a génfákat potenciális hibaforrásként ismerték a genomikai vizsgálatokban és a topológia jelentősen befolyásolhatja az elemzés későbbi lépéseit, beépítettünk egy génfa javító lépést a csővezetékbe.

genetikai mátrix stratégia bináris opciók áttekintéséhez

Engedélyeztük a bemeneti génfák újraindítását, ha ez csökkentette a másolási költségeket. A P értékeket a Shimodaira — Hasegawa A szervezett filogenesekhez igazított szekvenciaadatok és az 1.

A géncsalád összehangolása alapján kiszámított összehangolt génfák felhasználásával az ortológok kódolása várhatóan pontosabb lesz az ortológ genetikai mátrix stratégia bináris opciók áttekintéséhez megtalálásában, mint bármelyik korábbi módszernél. Az algoritmus összeegyeztethető génfát vesz bemenetként, és először a génfa minden csomópontját pontozásként vagy specifikációs csomópontként pontozza, az leszármazott alfének közötti taxon átfedések alapján.

Ezután meghatározza a legbefogadóbb utat a génfán, amely fajonként csak egy gént tartalmaz, és amely nem tartalmaz egynél több másodlagos csomópontot, hanem a specifikációs csomópontok összes alfáját. Az első ortocsoportban a fehérjéket összekötő utat ezután törlik a génfából, így több alsó bort eredményeznek; az algoritmus addig ismétlődik, amíg az összes gépházban nem található egy orto-csoport.

Vegye figyelembe, hogy ebben a lépésben az ortocsoporton belüli belső kapcsolatoknak nem kell összhangban lenniük a fajviszonyokkal. A génfában található összes legközelebbi ortológ halmazt ábrázoló bináris karakterek egy mátrixba kerülnek, amely a jelenlegi megvalósításban NEXUS formátumú fájl Fontos szempont, hogy a NEXUS fájl kétféle információt tárol kommentárokként az egyes ortocsoportokkal kapcsolatban: először az ortocsoportot alkotó terminálok fehérje-azonosítóit és az azon részfák testvérkertjében található taxonok listáját, amelyben a az ortocsoport fehérjéit összekötő út származik.

Ez utóbbi alapvető fontosságú az orto-csoportot létrehozó fafa duplikációjának helyreállításához, mivel a csomópont, amelyben a duplikáció megtörtént, a legkevésbé inkluzív alfa, amely tartalmazza az orto-csoportban lévő taxonok és testvérének taxonja által meghatározott fajokat. Az ortológ kódoló algoritmust illusztráló folyamatábrát a 2.

A fent leírt ortológkódolás alkalmazható a génfákra. Vannak olyan géncsaládok is, amelyek kevesebb, mint négy fehérjét tartalmaznak, amelyek között az evolúciós kapcsolatokat csillagfa három fehérje írja le, vagy egyáltalán nem ábrázolható faszerkezetként két genetikai mátrix stratégia bináris opciók áttekintéséhez egy fehérje család. Ortocsoportnak neveztük a géncsalád legbefogadóbb fehérjekészletét, amely fajonként csak egy fehérjét tartalmaz.

A négy proteinnél kisebb géncsaládok közül csak azokat vettük figyelembe, amelyek vagy több fajból származó fehérjéket tartalmaznak, vagy szignifikáns szekvenciaszintű hasonlóságot mutattak amint azt a BLAST következteti az NCBI-n egy másik fajból ismert fehérjével. Ezzel a kritériummal kizártunk számos lehetséges kommentár- és előrejelzési hibát, amelyek egyébként zajt jelentettek volna elemzéseinkhez. Egyszerre egy génfáról kódolt ortogruppokat térképeztünk fel és rögzítettük a nyereségek duplikációk és veszteségek számát a fafa minden ágán Kiegészítő 1.

A génfa hiba súlyos hatással lehet a párhuzamos következtetések következtetésére, és különösen a veszteségi eseményekre a génfa-fafa-fák egyeztetési módszereiben Eredményeink robusztusságának további vizsgálatához a génfa minőségének bevitelekor genetikai mátrix stratégia bináris opciók áttekintéséhez génfa gyűjteményre térképeztünk, amelyek közül az egyik a TreeFix által összehangolt génfák halmaza, a másik a tisztán szekvencia alapú ML fák RAxML-ből és a harmadik középpontban gyökerező ML fák voltak.

Megállapítottuk, hogy a következtetett másolatok száma viszonylag robusztus, míg a veszteségek száma jelentősen különbözik a három leképezés között. Ezért azt a következtetést vonhatjuk le, hogy a kiterjedt konvergens génveszteségeket, amelyeket ezekben a cladesben megfigyeltünk, nem befolyásolja a génfa hiba. Taxon mintavétel Készítettünk 59 genomot, amelyek a gombák összes szekvenált vonalát képviselik, és a outgroup fajok gyűjteményét.

A gombák között a legkorábban eltérõ törzskönyvek, a Kickxellomycotina Coemansia erectaaz Entomophthoramycotina Conidiobolus coronatusa Chytridiomycota Batrachochytrium dendrobatidis és a Spizellomyces punctatus képviselőit, valamint a Mucoromy 3 képviselőit is bevontuk. Az adatkészletben a szekvenált élesztőszerű gombák valamennyi vonalát képviselik, ideértve azokat genetikai mátrix stratégia bináris opciók áttekintéséhez fajokat is, amelyek kizárólag egysejtű élesztő formájában nőnek fel, valamint a dimorf gombákat, amelyek válthatják a hipál és az egysejtű formák között.

Az adatkészlet mind basidiomycetous, mind ascomycetous élesztőket tartalmaz, beleértve a kezdő és a hasadó élesztők képviselőit.

genetikai mátrix stratégia bináris opciók áttekintéséhez

Az Ascomycetous fekete élesztőket az Exophiala dermatitidis Wangiella dermatitidis képviseli. Az ökológiai stratégiák széles skáláját is lefedik, ideértve az opportunista emberi, állati és növényi kórokozókat, szabadon élő szaprobokat, kőzetben élő fekete élesztőket, valamint az intracelluláris parazitákat Mixia osmundae Az élesztõn növekedni képes gombák eloszlását az 1.

Szerves filogenetikai elemzések Az ML és a bayes-i Markov-lánc Monte Carlo egy példányú génjein alapuló fafajból következtettünk. Az MCL klaszterek között azonosítottuk az egy példányú géncsaládokat inflációs paraméter: 2, 0amelyek legalább 15 fajban voltak jelen, valamint azokat, amelyek nem voltak szigorúan egyetlen példányban, de amelyekben a másolatok csak a terminális ágakban fordultak elő azaz, csak párbeszédek engedélyezettek.

A mély paralogénekkel rendelkező géncsaládokat az ML génfák alapján kizártuk. A csak terminális duplikációt mutató géncsaládok esetében véletlenszerűen választottuk meg az filozófiai elemzéshez az inparalogokat, a többi nem került további vizsgálatba. A génfákat a RAxML 7.

Az egy génbeli illesztéseket tovább szűrtük a nem ortológ szekvenciákra a Az egyértelműen igazított és alacsony megbízhatóságú régiót kizártuk az igazításokból, ellenőrizve a PRANK által kiszámított és az XML fájlokban tárolt helyszíni posterior valószínűségeket. Mindegyik igazítási helyre összefoglaltuk az összes maradék hátsó valószínűségét és kiszámítottuk azok átlagát; csak azokat a helyeket tartottuk meg, amelyekben a hátsó valószínűségek átlaga meghaladta az előre beállított küszöböt.

Ezeket az elemzéseket egyéni írásbeli Perl szkript FilterPostProb. Három különböző küszöböt használtunk: 0, 95, 0, 98 és 1, 0. Ez egy nagyon szigorú kritérium, ám a hiányzó szekvenciákat nem számítják hiányosságoknak ellentétben ps opciók sorai GBlocks-szelami azt jelenti, hogy még ha egyes fajoknak hiányoznak is a gén szekvenciaadatai, az igazítási pontosságot a szekvenciájú fajok összefüggésében kell értékelni.

Továbbá, mivel a PRANK hátsó valószínűségei figyelembe veszik a beillesztés-törlés folyamatát, a nagy megbízhatóságú régiók az indel-ekkel megmaradnak. Az 50 aminosavnál hosszabb egy génbeli igazításokat szupermatrixba összekapcsoltuk, a bemeneti igazítások kezdő és végpontjait feljegyezve a megosztott modellek felállításához.