A transzmembrán fehérjék topológa becslésének pontossága nagymértékben növelhető, ha a becslés során figyelembe vesszük azokat az adatokat, amelyek egyértelműen meghatározzák a vizsgált fehérje adott szakaszának membránhoz viszonyított helyzetét. Ezek az adatok lehetnek kísérleti úton meghatározott topológia adatok, illetve olyan fehérje doménok vagy motivumok, amelyek a transzmembrán fehérjékben konzisztensen, mindig azonos oldal találhatók meg. Ezeket az adatokat gyűjtöttük egybe a TOPDB és a TOPDOM adatbázisokban.
A transzmembrán fehérjék szerkezet meghatározása során az egyik legfontosabb információ elveszik, mégpedig az, hogy hogyan helyezkedett el a fehérje eredetileg a kettős lipidrétegben. Ennek pótlására dolgoztuk ki a TMDET algoritmust, amelynek segítségével meghatározotuk a PDB adatbázisban levő valamennyi transzmembrán fehérje membránba ágyazott helyzetét. Ezeket az adatokat a PDBTM adatbázisban foglaltuk össze.
Ezen túlmenően létrehoztuk a HTP adatbázist, amely az emberi α-helikális transzmembrán fehérjék becsült és/vagy kísérletesen igazolt topológiáját tartalmazza a predikció megbízhatóságát is megadva. Az emberi transzmembrán proteom létrehozásához a CCTOP algoritmust használtuk mind a globuláris és transzmembrán fehérjék megkülönböztetésére, mind a topológia becslésére. Megmutattuk azt is, hogy a fehérje szintű topológia becslés pontossága a becslések 60%-ára 98% felett van a használt teszt adathalmazon, és valószínűleg az egész emberi transzmembrán fehérje proteomon.