FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0297, 1586 aa 1>>>pF1KE0297 1586 - 1586 aa - 1586 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 12.3590+/-0.00117; mu= -9.0643+/- 0.069 mean_var=420.6933+/-91.362, 0's: 0 Z-trim(114.3): 703 B-trim: 866 in 1/51 Lambda= 0.062530 statistics sampled from 14084 (14914) to 14084 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.747), E-opt: 0.2 (0.458), width: 16 Scan time: 5.520 The best scores are: opt bits E(32554) CCDS33283.1 GLI2 gene_id:2736|Hs108|chr2 (1586) 10843 994.0 0 CCDS5465.1 GLI3 gene_id:2737|Hs108|chr7 (1580) 2500 241.4 1.8e-62 CCDS53807.1 GLI1 gene_id:2735|Hs108|chr12 ( 978) 1207 124.6 1.6e-27 CCDS53806.1 GLI1 gene_id:2735|Hs108|chr12 (1065) 1207 124.6 1.7e-27 CCDS8940.1 GLI1 gene_id:2735|Hs108|chr12 (1106) 1207 124.6 1.8e-27 CCDS43784.1 GLIS3 gene_id:169792|Hs108|chr9 ( 930) 991 105.0 1.1e-21 CCDS6451.1 GLIS3 gene_id:169792|Hs108|chr9 ( 775) 976 103.6 2.5e-21 CCDS582.1 GLIS1 gene_id:148979|Hs108|chr1 ( 620) 775 85.4 6.1e-16 CCDS10511.1 GLIS2 gene_id:84662|Hs108|chr16 ( 524) 695 78.2 8e-14 CCDS9495.1 ZIC2 gene_id:7546|Hs108|chr13 ( 532) 619 71.3 9.4e-12 CCDS43160.1 ZIC4 gene_id:84107|Hs108|chr3 ( 334) 613 70.6 9.6e-12 CCDS54653.1 ZIC4 gene_id:84107|Hs108|chr3 ( 372) 613 70.6 1e-11 CCDS54652.1 ZIC4 gene_id:84107|Hs108|chr3 ( 384) 613 70.7 1.1e-11 CCDS9494.2 ZIC5 gene_id:85416|Hs108|chr13 ( 663) 615 71.0 1.4e-11 CCDS14663.1 ZIC3 gene_id:7547|Hs108|chrX ( 467) 603 69.8 2.3e-11 CCDS83494.1 ZIC3 gene_id:7547|Hs108|chrX ( 457) 598 69.4 3.1e-11 CCDS3136.1 ZIC1 gene_id:7545|Hs108|chr3 ( 447) 596 69.2 3.5e-11 >>CCDS33283.1 GLI2 gene_id:2736|Hs108|chr2 (1586 aa) initn: 10843 init1: 10843 opt: 10843 Z-score: 5302.6 bits: 994.0 E(32554): 0 Smith-Waterman score: 10843; 99.9% identity (100.0% similar) in 1586 aa overlap (1-1586:1-1586) 10 20 30 40 50 60 pF1KE0 METSASATASEKQEAKSGILEAAGFPDPGKKASPLVVAAAAAAAVAAQGVPQHLLPPFHA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 METSASATASEKQEAKSGILEAAGFPDPGKKASPLVVAAAAAAAVAAQGVPQHLLPPFHA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 PLPIDMRHQEGRYHYEPHSVHGVHGPPALSGSPVISDISLIRLSPHPAGPGESPFNAPHP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PLPIDMRHQEGRYHYEPHSVHGVHGPPALSGSPVISDISLIRLSPHPAGPGESPFNAPHP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 YVNPHMEHYLRSVHSSPTLSMISAARGLSPADVAQEHLKERGLFGLPAPGTTPSDYYHQM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 YVNPHMEHYLRSVHSSPTLSMISAARGLSPADVAQEHLKERGLFGLPAPGTTPSDYYHQM 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 TLVAGHPAPYGDLLMQSGGAASAPHLHDYLNPVDVSRFSSPRVTPRLSRKRALSISPLSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TLVAGHPAPYGDLLMQSGGAASAPHLHDYLNPVDVSRFSSPRVTPRLSRKRALSISPLSD 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 ASLDLQRMIRTSPNSLVAYINNSRSSSAASGSYGHLSAGALSPAFTFPHPINPVAYQQIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ASLDLQRMIRTSPNSLVAYINNSRSSSAASGSYGHLSAGALSPAFTFPHPINPVAYQQIL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 SQQRGLGSAFGHTPPLIQPSPTFLAQQPMALTSINATPTQLSSSSNCLSDTNQNKQSSES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SQQRGLGSAFGHTPPLIQPSPTFLAQQPMALTSINATPTQLSSSSNCLSDTNQNKQSSES 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE0 AVSSTVNPVAIHKRSKVKTEPEGLRPASPLALTQGQVSGHGSCGCALPLSQEQLADLKED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 AVSSTVNPVAIHKRSKVKTEPEGLRPASPLALTQGQVSGHGSCGCALPLSQEQLADLKED 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE0 LDRDDCKQEAEVVIYETNCHWEDCTKEYDTQEQLVHHINNEHIHGEKKEFVCRWQACTRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LDRDDCKQEAEVVIYETNCHWEDCTKEYDTQEQLVHHINNEHIHGEKKEFVCRWQACTRE 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE0 QKPFKAQYMLVVHMRRHTGEKPHKCTFEGCSKAYSRLENLKTHLRSHTGEKPYVCEHEGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QKPFKAQYMLVVHMRRHTGEKPHKCTFEGCSKAYSRLENLKTHLRSHTGEKPYVCEHEGC 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE0 NKAFSNASDRAKHQNRTHSNEKPYICKIPGCTKRYTDPSSLRKHVKTVHGPDAHVTKKQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 NKAFSNASDRAKHQNRTHSNEKPYICKIPGCTKRYTDPSSLRKHVKTVHGPDAHVTKKQR 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE0 NDVHLRTPLLKENGDSEAGTEPGGPESTEASSTSQAVEDCLHVRAIKTESSGLCQSSPGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 NDVHLRTPLLKENGDSEAGTEPGGPESTEASSTSQAVEDCLHVRAIKTESSGLCQSSPGA 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE0 QSSCSSEPSPLGSAPNNDSGVEMPGTGPGSLGDLTALDDTPPGADTSALAAPSAGGLQLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QSSCSSEPSPLGSAPNNDSGVEMPGTGPGSLGDLTALDDTPPGADTSALAAPSAGGLQLR 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE0 KHMTTMHRFEQLKKEKLKSLKDSCSWAGPTPHTRNTKLPPLPGSGSILENFSGSGGGGPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KHMTTMHRFEQLKKEKLKSLKDSCSWAGPTPHTRNTKLPPLPGSGSILENFSGSGGGGPA 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE0 GLLPNPRLSELSASEVTMLSQLQERRDSSTSTVSSAYTVSRRSSGISPYFSSRRSSEASP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GLLPNPRLSELSASEVTMLSQLQERRDSSTSTVSSAYTVSRRSSGISPYFSSRRSSEASP 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE0 LGAGRPHNASSADSYDPISTDASRRSSEASQCSGGSGLLNLTPAQQYSLRAKYAAATGGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LGAGRPHNASSADSYDPISTDASRRSSEASQCSGGSGLLNLTPAQQYSLRAKYAAATGGP 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE0 PPTPLPGLERMSLRTRLALLDAPERTLPAGCPRPLGPRRGSDGPTYGHGHAGAAPAFPHE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PPTPLPGLERMSLRTRLALLDAPERTLPAGCPRPLGPRRGSDGPTYGHGHAGAAPAFPHE 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE0 APGGGARRASDPVRRPDALSLPRVQRFHSTHNVNPGPLPPCADRRGLRLQSHPSTDGGLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 APGGGARRASDPVRRPDALSLPRVQRFHSTHNVNPGPLPPCADRRGLRLQSHPSTDGGLA 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE0 RGAYSPRPPSISENVAMEAVAAGVDGAGPEADLGLPEDDLVLPDDVVQYIKAHASGALDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RGAYSPRPPSISENVAMEAVAAGVDGAGPEADLGLPEDDLVLPDDVVQYIKAHASGALDE 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE0 GTGQVYPTESTGFSDNPRLPSPGLHGQRRMVAADSNVGPSAPMLGGCQLGFGAPSSLNKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GTGQVYPTESTGFSDNPRLPSPGLHGQRRMVAADSNVGPSAPMLGGCQLGFGAPSSLNKN 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE0 NMPVQWNEVSSGTVDSLASQVKPPPFPQGNLAVVQQKPAFGQYPGYSPQGLQASPGGLDS :::::::::::::::.:::::::::::::::::::::::::::::::::::::::::::: CCDS33 NMPVQWNEVSSGTVDALASQVKPPPFPQGNLAVVQQKPAFGQYPGYSPQGLQASPGGLDS 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE0 TQPHLQPRSGAPSQGIPRVNYMQQLRQPVAGSQCPGMTTTMSPHACYGQVHPQLSPSTIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TQPHLQPRSGAPSQGIPRVNYMQQLRQPVAGSQCPGMTTTMSPHACYGQVHPQLSPSTIS 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE0 GALNQFPQSCSNMPAKPGHLGHPQQTEVAPDPTTMGNRHRELGVPNSALAGVPPPHPVQS :::::::::::::::::::::::::::::::::::::::::::::.:::::::::::::: CCDS33 GALNQFPQSCSNMPAKPGHLGHPQQTEVAPDPTTMGNRHRELGVPDSALAGVPPPHPVQS 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE0 YPQQSHHLAASMSQEGYHQVPSLLPARQPGFMEPQTGPMGVATAGFGLVQPRPPLEPSPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 YPQQSHHLAASMSQEGYHQVPSLLPARQPGFMEPQTGPMGVATAGFGLVQPRPPLEPSPT 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KE0 GRHRGVRAVQQQLAYARATGHAMAAMPSSQETAEAVPKGAMGNMGSVPPQPPPQDAGGAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GRHRGVRAVQQQLAYARATGHAMAAMPSSQETAEAVPKGAMGNMGSVPPQPPPQDAGGAP 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KE0 DHSMLYYYGQIHMYEQDGGLENLGSCQVMRSQPPQPQACQDSIQPQPLPSPGVNQVSSTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 DHSMLYYYGQIHMYEQDGGLENLGSCQVMRSQPPQPQACQDSIQPQPLPSPGVNQVSSTV 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KE0 DSQLLEAPQIDFDAIMDDGDHSSLFSGALSPSLLHSLSQNSSRLTTPRNSLTLPSIPAGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 DSQLLEAPQIDFDAIMDDGDHSSLFSGALSPSLLHSLSQNSSRLTTPRNSLTLPSIPAGI 1510 1520 1530 1540 1550 1560 1570 1580 pF1KE0 SNMAVGDMSSMLTSLAEESKFLNMMT :::::::::::::::::::::::::: CCDS33 SNMAVGDMSSMLTSLAEESKFLNMMT 1570 1580 >>CCDS5465.1 GLI3 gene_id:2737|Hs108|chr7 (1580 aa) initn: 3350 init1: 1220 opt: 2500 Z-score: 1235.0 bits: 241.4 E(32554): 1.8e-62 Smith-Waterman score: 4182; 48.3% identity (69.0% similar) in 1583 aa overlap (51-1585:124-1579) 30 40 50 60 70 80 pF1KE0 EAAGFPDPGKKASPLVVAAAAAAAVAAQGVPQHLLPPFHAPLPIDMRHQEGRYHYEPHSV : ::.: :: :.::: ::.::::::.: . CCDS54 LPHVAEPSVPYRGTVFAMDPRNGYMEPHYHPPHLFPAFHPPVPIDARHHEGRYHYDPSPI 100 110 120 130 140 150 90 100 110 120 130 pF1KE0 HGVHGPPALSGSPVISDISLIRLSPH--PAGPGESPFNAPHPYVNPHMEHYLRSVHSSPT .: :::.::. :. .::.::: :.. .::::. ::::.::.:. :.::.::::. CCDS54 PPLHMTSALSSSPTYPDLPFIRISPHRNPTAASESPFSPPHPYINPYMD-YIRSLHSSPS 160 170 180 190 200 210 140 150 160 170 180 190 pF1KE0 LSMISAARGLSPADVAQEHLKERGLFGLPAPGTTPSDYYHQMTLVAGHPAPYGDLLMQSG ::::::.:::::.:. : :..:..:::::.:..:. .::.:.. ... CCDS54 LSMISATRGLSPTDA-------------PHAGVSPAEYYHQMALLTGQRSPYADIIPSAA 220 230 240 250 200 210 220 230 240 250 pF1KE0 GAASAPHLHDYLNPVDVSRFSSPRVTPRLSRKRALSISPLSDASLDLQRMIRTSPNSLVA :... .::. .: .::::::.. : ::::.:::::::: :.::: ::::::::::. CCDS54 TAGTGAIHMEYLHAMDSTRFSSPRLSARPSRKRTLSISPLSDHSFDLQTMIRTSPNSLVT 260 270 280 290 300 310 260 270 280 290 300 310 pF1KE0 YINNSRSSSAASGSYGHLSAGALSPAFTFPHPINPVA---YQQILSQQRGLGSAFGHTPP .:::::::.::::::::::.:.:::..: . ::. .:::::.:..:::::::.:: CCDS54 ILNNSRSSSSASGSYGHLSASAISPALSFTYSSAPVSLHMHQQILSRQQSLGSAFGHSPP 320 330 340 350 360 370 320 330 340 350 360 370 pF1KE0 LIQPSPTFLAQQPMALTSINATPTQLSSSSNCLSDTNQNKQSSESAVSSTVNPVAIHKRS ::.:.::: .:.:. .:.:.::. :...::: .:::::::: .:. .::: CCDS54 LIHPAPTFPTQRPIPGIPTVLNPVQVSSGP---SESSQNKPTSESAVSSTGDPMH-NKRS 380 390 400 410 420 430 380 390 400 410 420 430 pF1KE0 KVKTEPEGLRPASPLALTQGQVSGHGSCGCALPLSQEQLADLKEDLDRDDCKQEAEVVIY :.: :. : :: : .:: . : . .::. :.:. ::: :: :: CCDS54 KIK--PDEDLP-SPGA--RGQQE-----------QPEGTTLVKEEGDKDESKQEPEV-IY 440 450 460 470 440 450 460 470 480 490 pF1KE0 ETNCHWEDCTKEYDTQEQLVHHINNEHIHGEKKEFVCRWQACTREQKPFKAQYMLVVHMR ::::::: :..:.::::::::::::.::::::::::::: :.::::::::::::::::: CCDS54 ETNCHWEGCAREFDTQEQLVHHINNDHIHGEKKEFVCRWLDCSREQKPFKAQYMLVVHMR 480 490 500 510 520 530 500 510 520 530 540 550 pF1KE0 RHTGEKPHKCTFEGCSKAYSRLENLKTHLRSHTGEKPYVCEHEGCNKAFSNASDRAKHQN :::::::::::::::.:::::::::::::::::::::::::::::::::::::::::::: CCDS54 RHTGEKPHKCTFEGCTKAYSRLENLKTHLRSHTGEKPYVCEHEGCNKAFSNASDRAKHQN 540 550 560 570 580 590 560 570 580 590 600 610 pF1KE0 RTHSNEKPYICKIPGCTKRYTDPSSLRKHVKTVHGPDAHVTKKQRNDVHLRTPLLKENGD :::::::::.::::::::::::::::::::::::::.::::::::.:.: : : ...:. CCDS54 RTHSNEKPYVCKIPGCTKRYTDPSSLRKHVKTVHGPEAHVTKKQRGDIHPRPPPPRDSGS 600 610 620 630 640 650 620 630 640 650 660 pF1KE0 SEAGTEPGGP------ESTEASSTSQAVEDCLHVRAIKTESSGLCQSSPGAQSSCSSEPS . :: : :. . :.:.. :.::.:...:.:. : :::.::::::. : CCDS54 HSQSRSPGRPTQGALGEQQDLSNTTSKREECLQVKTVKAEKPMTSQPSPGGQSSCSSQQS 660 670 680 690 700 710 670 680 690 700 710 720 pF1KE0 PLGSAPNNDSGVEMPGTGPGSLGDLTALDDTPPGADTSALAAPSAGGLQLRKHMTTMHRF :... : ::.:.: : ::.:::.:.:.:: :.. .: .: .:: :.. . . . CCDS54 PISNYSN--SGLELPLTDGGSIGDLSAIDETPI-MDSTISTATTALALQARRNPAGTKWM 720 730 740 750 760 770 730 740 750 760 770 780 pF1KE0 EQLKKEKLKSLKDSCSWAGPTPHTRNTKLPPLPGSGSILENFSGSGGGGPAGLLPNPRLS :..: :.::... .: . . :: :.:. .: . :: : :::. : : CCDS54 EHVKLERLKQVNGMFPRLNPILPPKAPAVSPLIGNGTQSNNTCSLGG--PMTLLPG-R-S 780 790 800 810 820 830 790 800 810 820 830 840 pF1KE0 ELSASEVTMLSQLQERRDSSTSTVSSAYTVSRRSSGISPYFSSRRSSEASPLGAGRPHNA .::. .::::..:. :::::.::.:::: ::::::::: :::::::::: . :::.:. CCDS54 DLSGVDVTMLNMLN-RRDSSASTISSAYLSSRRSSGISPCFSSRRSSEASQ-AEGRPQNV 840 850 860 870 880 850 860 870 880 890 900 pF1KE0 SSADSYDPISTDASRRSSEASQCSGGSGLLNLTPAQQYSLRAKYAAATGGPPPTPLPGLE : :::::::::::::::::::: .: .::.::::::: :.::::::::::::::::..: CCDS54 SVADSYDPISTDASRRSSEASQSDGLPSLLSLTPAQQYRLKAKYAAATGGPPPTPLPNME 890 900 910 920 930 940 910 920 930 940 950 960 pF1KE0 RMSLRTRLALL-DA--PERTLPAGCPRPL-GPRRGSDGPTYGHGHAGAAPAFPHEAPGGG ::::.:::::: :: : .:: :. .::: ::: ..:.:. : :.::: : CCDS54 RMSLKTRLALLGDALEPGVALP-----PVHAPRRCSDGGAHGYGRRHLQP---HDAPGHG 950 960 970 980 990 1000 970 980 990 1000 1010 1020 pF1KE0 ARRASDPVRR-PDALSLPRVQRFHSTHNVNPGPLPPCADRRGLRLQSHPSTDGGLARGAY .:::::::: ..:.:::: :: : . :: . :..:.: ::.. .:: .:. . CCDS54 VRRASDPVRTGSEGLALPRVPRFSSLSSCNPPAMATSAEKRSLVLQNYTRPEGGQSRNFH 1010 1020 1030 1040 1050 1060 1030 1040 1050 1060 1070 1080 pF1KE0 S-PRPPSISENVAMEAVAAGVDGAGPEADLGLPEDDLVLPDDVVQYIKAHASGALDEGTG : : ::::.:::..:... .:: .: ..:. ::::::::.... .. : CCDS54 SSPCPPSITENVTLESLTM-------DADANLNDEDF-LPDDVVQYLNSQNQA----GYE 1070 1080 1090 1100 1090 1100 1110 1120 1130 1140 pF1KE0 QVYPTESTGFSDNPRLP-SPGLHGQRRMVAADSNVGPSAPML-GGCQLGFGAPSSLNKNN : .: ... :. ..: .:: . ::..: . : : : .:.. CCDS54 QHFP---SALPDDSKVPHGPGDFDAPGL--PDSHAGQQFHALEQPCPEG-------SKTD 1110 1120 1130 1140 1150 1150 1160 1170 1180 1190 pF1KE0 MPVQWNEVSSGTVDSLASQVK--P-PPFPQ-------GNLAVVQQKPAF-GQYPGYSPQG .:.::::::::..: .:..: : : :: ....: :.: : ::. : CCDS54 LPIQWNEVSSGSADLSSSKLKCGPRPAVPQTRAFGFCNGMVVHPQNPLRSGPAGGYQTLG 1160 1170 1180 1190 1200 1210 1200 1210 1220 1230 1240 pF1KE0 LQASP-GGLDSTQPHLQPRSGAPS-----QGIPRVNYMQQL-RQPVAGSQCPGMTTTMSP ...: :: . . : .: ::. . : .: . : ::::: :: CCDS54 ENSNPYGGPEHLMLHNSPGSGTSGNAFHEQPCKAPQYGNCLNRQPVA----PGALD---- 1220 1230 1240 1250 1260 1250 1260 1270 1280 1290 1300 pF1KE0 HACYGQVHP-QLSPSTISGALNQFPQSCSNMPAKP-GHLGHPQQTEVAPDPTTMGN-RHR :: . .. .:. . ..:. .:. . : . : . . .:.. ::. .: :. CCDS54 GACGAGIQASKLKSTPMQGSGGQLNFGLPVAPNESAGSMVNGMQNQ---DPVGQGYLAHQ 1270 1280 1290 1300 1310 1320 1310 1320 1330 1340 1350 pF1KE0 ELGVPNSALAGVPPPHPVQSYP-QQSHHLAASMSQEGYHQVP-SLLPARQPGFMEPQTGP :: .: :: . : :: .. :. . .: : : ::. . : CCDS54 LLG--DSM------QHPGAGRPGQQMLGQISATSHINIYQGPESCLPGAH--------G- 1330 1340 1350 1360 1360 1370 1380 1390 1400 1410 pF1KE0 MGVATAGFGLVQPRPPLEPSPTGRHRGVRAVQQQLAYARATGHAMAAMPSSQETAEAVPK :: .....:. : : : .: :. : . :. :.: . . CCDS54 MGSQPSSLAVVRGYQPCA-SFGGSRRQ--------AMPRDS----LALQSGQLSDTSQTC 1370 1380 1390 1400 1410 1420 1430 1440 1450 1460 1470 pF1KE0 GAMGNMGSVPPQPPPQDAGGAPDHSMLYYYGQIHMYEQDGGLENLGSCQVMRSQPPQPQA . : . :: : .. ..: .: . . .:: . :: .. . . CCDS54 RVNGIKMEMKGQPHPL-CSNLQNYSGQFYDQTVGFSQQD---TKAGSFSI------SDAS 1420 1430 1440 1450 1460 1480 1490 1500 1510 1520 1530 pF1KE0 CQ---DSIQPQPLPSPGVNQVSSTVDS---QLLEAPQIDFDAIMDDGDHSSLFSGALSPS : : . . : :::.:::.::::: . ::. :::::::.::::::::.::::::: CCDS54 CLLQGTSAKNSELLSPGANQVTSTVDSLDSHDLEGVQIDFDAIIDDGDHSSLMSGALSPS 1470 1480 1490 1500 1510 1520 1540 1550 1560 1570 1580 pF1KE0 LLHSLSQNSSRLTTPRNSLTLPSIPAGISNMAVGDMSSMLTSLAEESKFLNMMT ....::..:::::::: :: .:.. . .:::.:::::.::::::::::: .: CCDS54 IIQNLSHSSSRLTTPRASLPFPALSMSTTNMAIGDMSSLLTSLAEESKFLAVMQ 1530 1540 1550 1560 1570 1580 >>CCDS53807.1 GLI1 gene_id:2735|Hs108|chr12 (978 aa) initn: 1618 init1: 1096 opt: 1207 Z-score: 607.5 bits: 124.6 E(32554): 1.6e-27 Smith-Waterman score: 1725; 36.1% identity (53.1% similar) in 1201 aa overlap (394-1583:68-975) 370 380 390 400 410 420 pF1KE0 STVNPVAIHKRSKVKTEPEGLRPASPLALTQGQVSGHGSCGCALPLSQEQLADLKEDLDR .:..:. .: : :: . : .:::.: CCDS53 PHPQSRGPFPTCQLKSELDMLVGKCREEPLEGDMSSPNSTGIQDPLLG--MLDGREDLER 40 50 60 70 80 90 430 440 450 460 470 480 pF1KE0 DDCKQEAEVVIYETNCHWEDCTKEYDTQEQLVHHINNEHIHGEKKEFVCRWQACTREQKP .. :.: : : :::.:.:. :..:.:.:::::::::.::::::.:::::.: .:.:: .: CCDS53 EE-KREPESV-YETDCRWDGCSQEFDSQEQLVHHINSEHIHGERKEFVCHWGGCSRELRP 100 110 120 130 140 150 490 500 510 520 530 540 pF1KE0 FKAQYMLVVHMRRHTGEKPHKCTFEGCSKAYSRLENLKTHLRSHTGEKPYVCEHEGCNKA ::::::::::::::::::::::::::: :.::::::::::::::::::::.::::::.:: CCDS53 FKAQYMLVVHMRRHTGEKPHKCTFEGCRKSYSRLENLKTHLRSHTGEKPYMCEHEGCSKA 160 170 180 190 200 210 550 560 570 580 590 600 pF1KE0 FSNASDRAKHQNRTHSNEKPYICKIPGCTKRYTDPSSLRKHVKTVHGPDAHVTKKQRNDV :::::::::::::::::::::.::.:::::::::::::::::::::::::::::..:.: CCDS53 FSNASDRAKHQNRTHSNEKPYVCKLPGCTKRYTDPSSLRKHVKTVHGPDAHVTKRHRGDG 220 230 240 250 260 270 610 620 630 640 650 660 pF1KE0 HL-RTPLLKENGDSEAGTE-PGGPESTEASSTSQAVEDCLHVRAIKTESSGLCQSSPGAQ : :.: .. : : ::: :. : :.. : ::::: CCDS53 PLPRAPSIST---VEPKREREGGPIREES-------------RLTVPEGAMKPQPSPGAQ 280 290 300 310 670 680 690 700 710 720 pF1KE0 SSCSSEPSPLGSAPNNDSGVEMPGTGPGSLGDLTALDDTPPGADTSALAAPSAGGLQLRK :::::. :: ::: :.:::::: :.. :: ::..::. : : :. CCDS53 SSCSSDHSPAGSAANTDSGVEMTGNAGGSTEDLSSLDEGPCIAGTG-------------- 320 330 340 350 360 730 740 750 760 770 780 pF1KE0 HMTTMHRFEQLKKEKLKSLKDSCSWAGPTPHTRNTKLPPLPGSGSILENFSGSGGGGPAG ..:..:.:.:. ..:..:. : ::. ::: : .:. . : :.. CCDS53 -LSTLRRLENLRLDQLHQLR-------PIG-TRGLKLPSLSHTGTTVSRRVGP----PVS 370 380 390 400 410 790 800 810 820 830 840 pF1KE0 LLPNPRLSELSASEVTMLSQLQERRDSSTSTVSSAYTVSRRSSGISPYFSSRRSSEASPL : :::.::.:..::::::::::: ::. : CCDS53 L---------------------ERRSSSSSSISSAYTVSRRSSLASPF----------PP 420 430 850 860 870 880 890 900 pF1KE0 GAGRPHNASSADSYDPISTDASRRSSEASQCSGGSGLLNLTPAQQYSLRAKYAAATGG-P :. :.: :.:.: .: :::.: :::.::.: :: CCDS53 GSP-PEN-------------------------GASSLPGLMPAQHYLLRARYASARGGGT 440 450 460 470 910 920 930 940 950 960 pF1KE0 PPTPLPGLERMSLRTRLALLDAPERTLPAGCPRPLGPRRGSDGPTYGHGHAGAAPAFPHE :: .:.:.. : : : : :. .: CCDS53 SPTAASSLDRIG-----------------GLPMP--PWRSR-------------AEYPGY 480 490 500 970 980 990 1000 1010 pF1KE0 APGGGA-RRASDPVRRPDALSLPRVQRFHSTHNVNPGPLPPCADRRGLRLQSHPSTDGGL :..:. ::::::.. : . :::::.: :. :: . : . : : CCDS53 NPNAGVTRRASDPAQAADRPAPARVQRFKSLGCVH---TPPTVAGGGQNF------DPYL 510 520 530 540 550 1020 1030 1040 1050 1060 1070 pF1KE0 ARGAYSPRPPSISENVAMEAVAAGVDGAGPEADLGLPEDDLVLPDDVVQYIKAHASGALD ..:::.::::.::.::.: :: :. :. .... . . .: CCDS53 PTSVYSPQPPSITENAAMDAR-------------GLQEE----PEVGTSMVGSGLNPYMD 560 570 580 590 1080 1090 1100 1110 1120 1130 pF1KE0 EGTGQVYPTESTGFSDNPRLPSPGLHGQRRMVAADSNVGPSAPMLGGCQLGFGAPSSLNK ::.. :.. .:. . .: : :: :. :: : :.. . CCDS53 -----FPPTDTLGYG-GPEGAAAEPYGAR---------GP-----GSLPLGPGPPTNYGP 600 610 620 630 1140 1150 1160 1170 1180 1190 pF1KE0 NNMPVQWNEVSSGTVDSLASQVKPPPFPQGNLAVVQQKPAF-GQYPGYSPQGLQASPGGL : : : :: : :.. :. : ::: :..: :: CCDS53 NPCPQQ------------ASYPDPTQETWGEF------PSHSGLYPG--PKAL----GGT 640 650 660 670 1200 1210 1220 1230 1240 1250 pF1KE0 DSTQPHLQPRSGA---PSQGIPRVNYMQQLRQPVAGSQCPGMTTTMSPHACYGQVHPQLS : :.:. . . : :: : .::. :.. .. : : ::: CCDS53 YSQCPRLEHYGQVQVKPEQGCP------------VGSDSTGLAPCLNAHPSEGPPHPQ-- 680 690 700 710 1260 1270 1280 1290 1300 1310 pF1KE0 PSTISGALNQFPQSCSNMPAKPGHLGHPQQTEVAPDPTTMGNRHR---ELGVPNSALAGV : ....:: :. : .: :. : : . .. : .. :. . .: CCDS53 P-----LFSHYPQ-----PSPPQYLQSGPYTQ--PPPDYLPSEPRPCLDFDSPTHS-TGQ 720 730 740 750 760 1320 1330 1340 1350 1360 1370 pF1KE0 PPPHPVQSYPQQSHHLAASMSQEGYHQVPSLLPARQPGFMEPQTGPMGVATAGFGLVQPR . : .: :....: :: . . ::..:... :. .: : CCDS53 LKAQLVCNYVQSQQELL----WEGGGREDA--PAQEPSYQSPKF---------LGGSQVS 770 780 790 800 1380 1390 1400 1410 1420 1430 pF1KE0 PPLEPSPTGRHRGVRAVQQQLAYARATGHAMAAMPSSQETAEAVPKGAMGNMGSVPPQPP : .:.. . : . .: .: ...:. . : :: : .: : CCDS53 PSRAKAPVNTY-GP-GFGPNLP-----NHKSGSYPTPSPCHENFVVGA--NRASHRAAAP 810 820 830 840 850 860 1440 1450 1460 1470 1480 1490 pF1KE0 PQDAGGAPDHSMLYYYGQIHMYEQDGGLENLGSCQVMRSQPPQPQACQDSIQPQPLPSPG :. : :: ... :: . :: .:.. . . : : : CCDS53 PRLLPPLPTC-----YGPLKV----GGTN--PSCG-------HPEVGRLGGGPALYPPPE 870 880 890 900 1500 1510 1520 1530 1540 1550 pF1KE0 VNQVSSTVDSQLLEAPQIDFDAIMDDGDHSSLFSGALSPSLLHSLSQNSSRLTTPRNSLT .:: . .:: :. :.:: ::.:. . .::: :. : .: :: CCDS53 -GQVCNPLDSLDLDNTQLDFVAILDEPQ-------GLSPPPSHD--QRGSSGHTP----- 910 920 930 940 1560 1570 1580 pF1KE0 LPSIPAGISNMAVGDMSSMLTSLAEESKFLNMMT : :.: :::::.:: .: :: :..::: CCDS53 -P--PSGPPNMAVGNMSVLLRSLPGETEFLNSSA 950 960 970 >>CCDS53806.1 GLI1 gene_id:2735|Hs108|chr12 (1065 aa) initn: 1771 init1: 1096 opt: 1207 Z-score: 607.0 bits: 124.6 E(32554): 1.7e-27 Smith-Waterman score: 1937; 35.9% identity (52.7% similar) in 1398 aa overlap (202-1583:6-1062) 180 190 200 210 220 pF1KE0 TPSDYYHQMTLVAGHPAPYGDLLMQSGGAASAPHLHDYLNPVDVSRFSS---PRVTP--R . : . .: .: . . : : : . CCDS53 MFNSMTPPPISSYGEPCCLRPLPSQGAPSVGTEVK 10 20 30 230 240 250 260 270 280 pF1KE0 LSRKRALSISPLSDASLDLQRMIRTSPNSLVAYINNSRSSSAASGSYGHLSAGALSPAFT :..::::::::::::::::: .:::::.::::.:: :: .: . ::::::: :..::.. CCDS53 LTKKRALSISPLSDASLDLQTVIRTSPSSLVAFIN-SRCTSPG-GSYGHLSIGTMSPSLG 40 50 60 70 80 90 290 300 310 320 330 340 pF1KE0 FPHPINPVAYQQILSQQRGLGSAFGHTPPLIQPSPTFLAQQPMALTSINATPTQLSSSSN :: .: .:.: . .:: .:: . . : .. : . . . CCDS53 FPAQMN---------HQKGPSPSFG-----VQPC----GPHDSARGGMIPHPQSRGPFPT 100 110 120 130 350 360 370 380 390 400 pF1KE0 CLSDTNQNKQSSESAVSSTVNPVAIHKRSKVKTEPEGLRPASPLALTQGQVSGHGSCGCA : : :. . :. : . :: .:..:. .: : CCDS53 C-----QLKSELDMLVG------------KCREEP-----------LEGDMSSPNSTGIQ 140 150 160 410 420 430 440 450 460 pF1KE0 LPLSQEQLADLKEDLDRDDCKQEAEVVIYETNCHWEDCTKEYDTQEQLVHHINNEHIHGE :: . : .:::.:.. :.: : : :::.:.:. :..:.:.:::::::::.:::::: CCDS53 DPLLG--MLDGREDLEREE-KREPESV-YETDCRWDGCSQEFDSQEQLVHHINSEHIHGE 170 180 190 200 210 220 470 480 490 500 510 520 pF1KE0 KKEFVCRWQACTREQKPFKAQYMLVVHMRRHTGEKPHKCTFEGCSKAYSRLENLKTHLRS .:::::.: .:.:: .:::::::::::::::::::::::::::: :.::::::::::::: CCDS53 RKEFVCHWGGCSRELRPFKAQYMLVVHMRRHTGEKPHKCTFEGCRKSYSRLENLKTHLRS 230 240 250 260 270 280 530 540 550 560 570 580 pF1KE0 HTGEKPYVCEHEGCNKAFSNASDRAKHQNRTHSNEKPYICKIPGCTKRYTDPSSLRKHVK :::::::.::::::.:::::::::::::::::::::::.::.:::::::::::::::::: CCDS53 HTGEKPYMCEHEGCSKAFSNASDRAKHQNRTHSNEKPYVCKLPGCTKRYTDPSSLRKHVK 290 300 310 320 330 340 590 600 610 620 630 640 pF1KE0 TVHGPDAHVTKKQRNDVHL-RTPLLKENGDSEAGTE-PGGPESTEASSTSQAVEDCLHVR :::::::::::..:.: : :.: .. : : ::: :. : CCDS53 TVHGPDAHVTKRHRGDGPLPRAPSIS---TVEPKREREGGPIREES-------------R 350 360 370 380 650 660 670 680 690 700 pF1KE0 AIKTESSGLCQSSPGAQSSCSSEPSPLGSAPNNDSGVEMPGTGPGSLGDLTALDDTPPGA :.. : ::::::::::. :: ::: :.:::::: :.. :: ::..::. : : CCDS53 LTVPEGAMKPQPSPGAQSSCSSDHSPAGSAANTDSGVEMTGNAGGSTEDLSSLDEGPCIA 390 400 410 420 430 440 710 720 730 740 750 760 pF1KE0 DTSALAAPSAGGLQLRKHMTTMHRFEQLKKEKLKSLKDSCSWAGPTPHTRNTKLPPLPGS : :: .:..:.:.:. ..:..:. : ::. ::: : . CCDS53 GT---------GL------STLRRLENLRLDQLHQLR-------PIG-TRGLKLPSLSHT 450 460 470 480 770 780 790 800 810 820 pF1KE0 GSILENFSGSGGGGPAGLLPNPRLSELSASEVTMLSQLQERRDSSTSTVSSAYTVSRRSS :. . : :..: :::.::.:..::::::::::: CCDS53 GTTVSRRVGP----PVSL---------------------ERRSSSSSSISSAYTVSRRSS 490 500 510 830 840 850 860 870 880 pF1KE0 GISPYFSSRRSSEASPLGAGRPHNASSADSYDPISTDASRRSSEASQCSGGSGLLNLTPA ::. .:: :.: :.:.: .: :: CCDS53 LASPF------PPGSP-----PEN-------------------------GASSLPGLMPA 520 530 540 890 900 910 920 930 940 pF1KE0 QQYSLRAKYAAATGG-PPPTPLPGLERMSLRTRLALLDAPERTLPAGCPRPLGPRRGSDG :.: :::.::.: :: :: .:.:.. : : : : :. CCDS53 QHYLLRARYASARGGGTSPTAASSLDRIG-----------------GLPMP--PWRSR-- 550 560 570 580 950 960 970 980 990 1000 pF1KE0 PTYGHGHAGAAPAFPHEAPGGGA-RRASDPVRRPDALSLPRVQRFHSTHNVNPGPLPPCA .: :..:. ::::::.. : . :::::.: :. :: . CCDS53 -----------AEYPGYNPNAGVTRRASDPAQAADRPAPARVQRFKSLGCVHT---PPTV 590 600 610 620 1010 1020 1030 1040 1050 1060 pF1KE0 DRRGLRLQSHPSTDGGLARGAYSPRPPSISENVAMEAVAAGVDGAGPEADLGLPEDDLVL : . : : ..:::.::::.::.::.: :: :. CCDS53 AGGGQNF------DPYLPTSVYSPQPPSITENAAMDAR-------------GLQEE---- 630 640 650 660 1070 1080 1090 1100 1110 1120 pF1KE0 PDDVVQYIKAHASGALDEGTGQVYPTESTGFSDNPRLPSPGLHGQRRMVAADSNVGPSAP :. .... . . .: ::.. :.. : .: :: : .: CCDS53 PEVGTSMVGSGLNPYMD-----FPPTDTLGYG--------GPEG-----AAAEPYGARGP 670 680 690 700 1130 1140 1150 1160 1170 1180 pF1KE0 MLGGCQLGFGAPSSLNKNNMPVQWNEVSSGTVDSLASQVKPPPFPQGNLAVVQQKPAF-G :. :: : :.. . : : : :: : :.. :. : CCDS53 --GSLPLGPGPPTNYGPNPCPQQ------------ASYPDPTQETWGEF------PSHSG 710 720 730 740 1190 1200 1210 1220 1230 pF1KE0 QYPGYSPQGLQASPGGLDSTQPHLQPRSGA---PSQGIPRVNYMQQLRQPVAGSQCPGMT ::: :..: :: : :.:. . . : :: : .::. :.. CCDS53 LYPG--PKAL----GGTYSQCPRLEHYGQVQVKPEQGCP------------VGSDSTGLA 750 760 770 780 1240 1250 1260 1270 1280 1290 pF1KE0 TTMSPHACYGQVHPQLSPSTISGALNQFPQSCSNMPAKPGHLGHPQQTEVAPDPTTMGNR .. : : ::: : ....:: :. : .: :. : : . .. CCDS53 PCLNAHPSEGPPHPQ--P-----LFSHYPQ-----PSPPQYLQSGPYTQ--PPPDYLPSE 790 800 810 820 830 1300 1310 1320 1330 1340 1350 pF1KE0 HR---ELGVPNSALAGVPPPHPVQSYPQQSHHLAASMSQEGYHQVPSLLPARQPGFMEPQ : .. :. . .: . : .: :....: :: . . ::..:... :. CCDS53 PRPCLDFDSPTHS-TGQLKAQLVCNYVQSQQELL----WEGGGREDA--PAQEPSYQSPK 840 850 860 870 880 1360 1370 1380 1390 1400 1410 pF1KE0 TGPMGVATAGFGLVQPRPPLEPSPTGRHRGVRAVQQQLAYARATGHAMAAMPSSQETAEA .: : : .:.. . . .: .: ...:. . : CCDS53 F---------LGGSQVSPSRAKAPVNTYGP--GFGPNLP-----NHKSGSYPTPSPCHEN 890 900 910 920 930 1420 1430 1440 1450 1460 1470 pF1KE0 VPKGAMGNMGSVPPQPPPQDAGGAPDHSMLYYYGQIHMYEQDGGLENLGSCQVMRSQPPQ :: : .: ::. : :: ... :: . :: . CCDS53 FVVGA--NRASHRAAAPPRLLPPLPTC-----YGPLKV----GGTN--PSCG-------H 940 950 960 970 1480 1490 1500 1510 1520 1530 pF1KE0 PQACQDSIQPQPLPSPGVNQVSSTVDSQLLEAPQIDFDAIMDDGDHSSLFSGALSPSLLH :.. . . : : : .:: . .:: :. :.:: ::.:. . .::: : CCDS53 PEVGRLGGGPALYPPPE-GQVCNPLDSLDLDNTQLDFVAILDEPQ-------GLSPPPSH 980 990 1000 1010 1020 1540 1550 1560 1570 1580 pF1KE0 SLSQNSSRLTTPRNSLTLPSIPAGISNMAVGDMSSMLTSLAEESKFLNMMT . : .: :: : :.: :::::.:: .: :: :..::: CCDS53 D--QRGSSGHTP------P--PSGPPNMAVGNMSVLLRSLPGETEFLNSSA 1030 1040 1050 1060 >>CCDS8940.1 GLI1 gene_id:2735|Hs108|chr12 (1106 aa) initn: 1814 init1: 1096 opt: 1207 Z-score: 606.7 bits: 124.6 E(32554): 1.8e-27 Smith-Waterman score: 1975; 35.7% identity (52.9% similar) in 1432 aa overlap (165-1583:26-1103) 140 150 160 170 180 190 pF1KE0 SSPTLSMISAARGLSPADVAQEHLKERGLFGLPAPGT---TPSDYYHQMTLVAGHPAPYG : :. :: . . :: .:..: : :: CCDS89 MFNSMTPPPISSYGEPCCLRPLPSQGAPSVGTEGLSGPPFCHQANLMSG-PHSYG 10 20 30 40 50 200 210 220 230 240 250 pF1KE0 DLLMQSGGAASAPHLHDYLNPVDVSRFSSPRVTPRLSRKRALSISPLSDASLDLQRMIRT .... . .: ::::: . .:..::::::::::::::::: .::: CCDS89 PA-RETNSCTEGPL------------FSSPRSAVKLTKKRALSISPLSDASLDLQTVIRT 60 70 80 90 100 260 270 280 290 300 310 pF1KE0 SPNSLVAYINNSRSSSAASGSYGHLSAGALSPAFTFPHPINPVAYQQILSQQRGLGSAFG ::.::::.:: :: .: . ::::::: :..::.. :: .: .:.: . .:: CCDS89 SPSSLVAFIN-SRCTSPG-GSYGHLSIGTMSPSLGFPAQMN---------HQKGPSPSFG 110 120 130 140 150 320 330 340 350 360 370 pF1KE0 HTPPLIQPSPTFLAQQPMALTSINATPTQLSSSSNCLSDTNQNKQSSESAVSSTVNPVAI .:: . . : .. : . . .: : :. . :. CCDS89 -----VQPC----GPHDSARGGMIPHPQSRGPFPTC-----QLKSELDMLVG-------- 160 170 180 380 390 400 410 420 430 pF1KE0 HKRSKVKTEPEGLRPASPLALTQGQVSGHGSCGCALPLSQEQLADLKEDLDRDDCKQEAE : . :: .:..:. .: : :: . : .:::.:.. :.: : CCDS89 ----KCREEP-----------LEGDMSSPNSTGIQDPLL--GMLDGREDLEREE-KREPE 190 200 210 220 230 440 450 460 470 480 490 pF1KE0 VVIYETNCHWEDCTKEYDTQEQLVHHINNEHIHGEKKEFVCRWQACTREQKPFKAQYMLV : :::.:.:. :..:.:.:::::::::.::::::.:::::.: .:.:: .::::::::: CCDS89 SV-YETDCRWDGCSQEFDSQEQLVHHINSEHIHGERKEFVCHWGGCSRELRPFKAQYMLV 240 250 260 270 280 500 510 520 530 540 550 pF1KE0 VHMRRHTGEKPHKCTFEGCSKAYSRLENLKTHLRSHTGEKPYVCEHEGCNKAFSNASDRA ::::::::::::::::::: :.::::::::::::::::::::.::::::.:::::::::: CCDS89 VHMRRHTGEKPHKCTFEGCRKSYSRLENLKTHLRSHTGEKPYMCEHEGCSKAFSNASDRA 290 300 310 320 330 340 560 570 580 590 600 610 pF1KE0 KHQNRTHSNEKPYICKIPGCTKRYTDPSSLRKHVKTVHGPDAHVTKKQRNDVHL-RTPLL :::::::::::::.::.:::::::::::::::::::::::::::::..:.: : :.: . CCDS89 KHQNRTHSNEKPYVCKLPGCTKRYTDPSSLRKHVKTVHGPDAHVTKRHRGDGPLPRAPSI 350 360 370 380 390 400 620 630 640 650 660 670 pF1KE0 KENGDSEAGTEPGGPESTEASSTSQAVEDCLHVRAIKTESSGLCQSSPGAQSSCSSEPSP . .. . ::: :. : :.. : ::::::::::. :: CCDS89 STVEPKR--EREGGPIREES-------------RLTVPEGAMKPQPSPGAQSSCSSDHSP 410 420 430 440 450 680 690 700 710 720 730 pF1KE0 LGSAPNNDSGVEMPGTGPGSLGDLTALDDTPPGADTSALAAPSAGGLQLRKHMTTMHRFE ::: :.:::::: :.. :: ::..::. : : : :: .:..:.: CCDS89 AGSAANTDSGVEMTGNAGGSTEDLSSLDEGPCIAGT---------GL------STLRRLE 460 470 480 490 740 750 760 770 780 790 pF1KE0 QLKKEKLKSLKDSCSWAGPTPHTRNTKLPPLPGSGSILENFSGSGGGGPAGLLPNPRLSE .:. ..:..:. : ::. ::: : .:. . : :..: CCDS89 NLRLDQLHQLR-------PIG-TRGLKLPSLSHTGTTVSRRVGP----PVSL-------- 500 510 520 530 800 810 820 830 840 850 pF1KE0 LSASEVTMLSQLQERRDSSTSTVSSAYTVSRRSSGISPYFSSRRSSEASPLGAGRPHNAS :::.::.:..::::::::::: ::. : :. :.: CCDS89 -------------ERRSSSSSSISSAYTVSRRSSLASPF----------PPGSP-PEN-- 540 550 560 570 860 870 880 890 900 pF1KE0 SADSYDPISTDASRRSSEASQCSGGSGLLNLTPAQQYSLRAKYAAATGG-PPPTPLPGLE :.:.: .: :::.: :::.::.: :: :: .:. CCDS89 -----------------------GASSLPGLMPAQHYLLRARYASARGGGTSPTAASSLD 580 590 600 610 910 920 930 940 950 960 pF1KE0 RMSLRTRLALLDAPERTLPAGCPRPLGPRRGSDGPTYGHGHAGAAPAFPHEAPGGGA-RR :.. : : : : :. .: :..:. :: CCDS89 RIG-----------------GLPMP--PWRSR-------------AEYPGYNPNAGVTRR 620 630 970 980 990 1000 1010 1020 pF1KE0 ASDPVRRPDALSLPRVQRFHSTHNVNPGPLPPCADRRGLRLQSHPSTDGGLARGAYSPRP ::::.. : . :::::.: :. :: . : . : : ..:::.: CCDS89 ASDPAQAADRPAPARVQRFKSLGCVHT---PPTVAGGGQNF------DPYLPTSVYSPQP 640 650 660 670 680 1030 1040 1050 1060 1070 1080 pF1KE0 PSISENVAMEAVAAGVDGAGPEADLGLPEDDLVLPDDVVQYIKAHASGALDEGTGQVYPT :::.::.::.: :: :. :. .... . . .: :: CCDS89 PSITENAAMDAR-------------GLQEE----PEVGTSMVGSGLNPYMD-----FPPT 690 700 710 720 1090 1100 1110 1120 1130 1140 pF1KE0 ESTGFSDNPRLPSPGLHGQRRMVAADSNVGPSAPMLGGCQLGFGAPSSLNKNNMPVQWNE .. :.. .:. . .: : :: :. :: : :.. . : : : CCDS89 DTLGYG-GPEGAAAEPYGAR---------GP-----GSLPLGPGPPTNYGPNPCPQQ--- 730 740 750 760 1150 1160 1170 1180 1190 1200 pF1KE0 VSSGTVDSLASQVKPPPFPQGNLAVVQQKPAF-GQYPGYSPQGLQASPGGLDSTQPHLQP :: : :.. :. : ::: :..: :: : :.:. CCDS89 ---------ASYPDPTQETWGEF------PSHSGLYPG--PKAL----GGTYSQCPRLEH 770 780 790 800 1210 1220 1230 1240 1250 1260 pF1KE0 RSGA---PSQGIPRVNYMQQLRQPVAGSQCPGMTTTMSPHACYGQVHPQLSPSTISGALN . . : :: : .::. :.. .. : : ::: : .. CCDS89 YGQVQVKPEQGCP------------VGSDSTGLAPCLNAHPSEGPPHPQ--P-----LFS 810 820 830 840 1270 1280 1290 1300 1310 1320 pF1KE0 QFPQSCSNMPAKPGHLGHPQQTEVAPDPTTMGNRHR---ELGVPNSALAGVPPPHPVQSY ..:: :. : .: :. : : . .. : .. :. . .: . : .: CCDS89 HYPQ-----PSPPQYLQSGPYTQ--PPPDYLPSEPRPCLDFDSPTHS-TGQLKAQLVCNY 850 860 870 880 890 900 1330 1340 1350 1360 1370 1380 pF1KE0 PQQSHHLAASMSQEGYHQVPSLLPARQPGFMEPQTGPMGVATAGFGLVQPRPPLEPSPTG :....: :: . . ::..:... :. .: : : .:.. CCDS89 VQSQQELL----WEGGGREDA--PAQEPSYQSPKF---------LGGSQVSPSRAKAPVN 910 920 930 940 1390 1400 1410 1420 1430 1440 pF1KE0 RHRGVRAVQQQLAYARATGHAMAAMPSSQETAEAVPKGAMGNMGSVPPQPPPQDAGGAPD . : . .: .: ...:. . : :: : .: ::. : CCDS89 TY-GP-GFGPNLP-----NHKSGSYPTPSPCHENFVVGA--NRASHRAAAPPRLLPPLPT 950 960 970 980 990 1450 1460 1470 1480 1490 1500 pF1KE0 HSMLYYYGQIHMYEQDGGLENLGSCQVMRSQPPQPQACQDSIQPQPLPSPGVNQVSSTVD :: ... :: . :: .:.. . . : : : .:: . .: CCDS89 C-----YGPLKV----GGTNP--SCG-------HPEVGRLGGGPALYPPPE-GQVCNPLD 1000 1010 1020 1030 1510 1520 1530 1540 1550 1560 pF1KE0 SQLLEAPQIDFDAIMDDGDHSSLFSGALSPSLLHSLSQNSSRLTTPRNSLTLPSIPAGIS : :. :.:: ::.:. . .::: :. : .: :: : :.: CCDS89 SLDLDNTQLDFVAILDEPQ-------GLSPPPSHD--QRGSSGHTP------P--PSGPP 1040 1050 1060 1070 1080 1570 1580 pF1KE0 NMAVGDMSSMLTSLAEESKFLNMMT :::::.:: .: :: :..::: CCDS89 NMAVGNMSVLLRSLPGETEFLNSSA 1090 1100 >>CCDS43784.1 GLIS3 gene_id:169792|Hs108|chr9 (930 aa) initn: 694 init1: 482 opt: 991 Z-score: 502.5 bits: 105.0 E(32554): 1.1e-21 Smith-Waterman score: 1025; 34.9% identity (56.6% similar) in 705 aa overlap (53-721:110-781) 30 40 50 60 70 pF1KE0 AGFPDPGKKASPLVVAAAAAAAVAAQGVPQHLLPP----FHAPLPIDMRHQEGRYHYEPH : : : : .:.: . .: . :. CCDS43 HLPALSPRRQMLTNGKPRFQVTQAGGMSGSHTLKPKQQEFGSPFPPN--PGKGALGFGPQ 80 90 100 110 120 130 80 90 100 110 120 130 pF1KE0 --SV-HGVHGPPALSGSPV-ISDISLIRLSPHPAGPGESPFNAPHPYVNPHMEHYLRSVH :. .: . ....::. .. ..:: :: ::. . : : .. :. .. CCDS43 CKSIGKGSCNNLVVTSSPMMVQRLGLI--SP-PASQVSTACNQISPSLQRAMNAANLNIP 140 150 160 170 180 190 140 150 160 170 180 pF1KE0 SSPTLSMIS------AARGLSPADVAQEHLKE--RGLFGLPAPGTTPSDYYHQMTLVAGH : : :.:: .. .:. .. :. .: .: .:: . :.. : : : CCDS43 PSDTRSLISRESLASTTLSLTESQSASSMKQEWSQGYRALP----SLSNHGSQNGLDLGD 200 210 220 230 240 250 190 200 210 220 230 240 pF1KE0 --PAPYGDLLMQSGGAASAPHL----HDYLNPVDVSRFSSPRVTPRLSRKRALSISPLSD : : . ... . : : .. .: : :: : :.:::::.::::: CCDS43 LLSLPPGTSMSSNSVSNSLPSYLFGTESSHSPYPSPRHSSTRSHSARSKKRALSLSPLSD 260 270 280 290 300 310 250 260 270 280 290 pF1KE0 A-SLDLQRMIRTSPNSLVAYINNSRSSSAASGS----YGHLSAGALSPAFTFPHPINPVA . ..:.. .:::::.:::::::.::.: : . :::. :. . . :.:. : . CCDS43 GIGIDFNTIIRTSPTSLVAYINGSRASPANLSPQPEVYGHF-LGVRGSCIPQPRPV-PGS 320 330 340 350 360 300 310 320 330 340 pF1KE0 YQQILSQQRGLG-SAFGHTPPLIQPSPTFLAQQPMALTSINATPTQLS-----SSSNCLS . .: ::. :.:. : . : . . .: .: . :.: : CCDS43 QKGVLVAPGGLALPAYGEDGALEHERMQQLEHGGLQPGLVNHMVVQHGLPGPDSQSAGLF 370 380 390 400 410 420 350 360 370 380 390 400 pF1KE0 DTNQNKQSSESAVSSTVNPVAIHKRSKVKTEPEGLRPASPLALTQGQVSGHGSCGCALPL :.. .. :.:. : : :. : : : : CCDS43 KTERLEEFPGSTVDLPPAP---------PLPPLPPPPGPPPPYHAHAHLHHPELG---PH 430 440 450 460 470 410 420 430 440 450 460 pF1KE0 SQEQLADLKEDLDRDDCKQEAEVVIYETNCHWEDCTKEYDTQEQLVHHINNEHIHGEKKE .: ::: . :: : : . . . :.: ::. :: ::.::.::.. :: .: : CCDS43 AQ-QLALPQATLDDDG---EMDGIGGKHCCRWIDCSALYDQQEELVRHIEKVHIDQRKGE 480 490 500 510 520 530 470 480 490 500 510 520 pF1KE0 -FVCRWQACTREQKPFKAQYMLVVHMRRHTGEKPHKCTFEGCSKAYSRLENLKTHLRSHT :.: : .: :. :::.:.: :..::: :.::::.::::::: ::.::::::: :::::: CCDS43 DFTCFWAGCPRRYKPFNARYKLLIHMRVHSGEKPNKCTFEGCEKAFSRLENLKIHLRSHT 540 550 560 570 580 590 530 540 550 560 570 580 pF1KE0 GEKPYVCEHEGCNKAFSNASDRAKHQNRTHSNEKPYICKIPGCTKRYTDPSSLRKHVKTV :::::.:.: ::.:::::.::::::: ::: . ::: :.:::::::::::::::::::. CCDS43 GEKPYLCQHPGCQKAFSNSSDRAKHQ-RTHLDTKPYACQIPGCTKRYTDPSSLRKHVKAH 600 610 620 630 640 650 590 600 610 620 630 640 pF1KE0 HGPDAHVTKKQRNDVHLRTPLLKENGDSEAGTEPGGPESTEASST-SQAVEDCLHVRAIK . . .. :: :....:. :: . .. .:... : .: ... . . CCDS43 SSKEQQARKKLRSSTELHPDLLTDCLTVQSLQPATSPRDAAAEGTVGRSPGPGPDLYSAP 660 670 680 690 700 710 650 660 670 680 690 700 pF1KE0 TESSGLCQSSPGAQSSCSSEPSPLGSAPNNDSGVEMPGTGPGS-LGDLTALDDTPPGADT ::. .: :. .. : :. : :. .:. .:.: : :::.: ::. CCDS43 IFSSNY-SSRSGTAAGAVPPPHPV-SHPSPGHNVQGSPHNPSSQLPPLTAVD---AGAER 720 730 740 750 760 710 720 730 740 750 760 pF1KE0 SALAAPSAGGLQLRKHMTTMHRFEQLKKEKLKSLKDSCSWAGPTPHTRNTKLPPLPGSGS : .::: .. :. CCDS43 FAPSAPSPHHISPRRVPAPSSILQRTQPPYTQQPSGSHLKSYQPETNSSFQPNGIHVHGF 770 780 790 800 810 820 >>CCDS6451.1 GLIS3 gene_id:169792|Hs108|chr9 (775 aa) initn: 694 init1: 482 opt: 976 Z-score: 496.3 bits: 103.6 E(32554): 2.5e-21 Smith-Waterman score: 1010; 35.9% identity (56.9% similar) in 647 aa overlap (103-721:9-626) 80 90 100 110 120 130 pF1KE0 YHYEPHSVHGVHGPPALSGSPVISDISLIRLSPHPAGPGESPFNAPHPYVNPHMEHYLRS .:: ::. . : : .. :. . CCDS64 MMVQRLGLISP-PASQVSTACNQISPSLQRAMNAANLN 10 20 30 140 150 160 170 180 pF1KE0 VHSSPTLSMIS------AARGLSPADVAQEHLKE--RGLFGLPAPGTTPSDYYHQMTLVA . : : :.:: .. .:. .. :. .: .: .:: . :.. : : CCDS64 IPPSDTRSLISRESLASTTLSLTESQSASSMKQEWSQGYRALP----SLSNHGSQNGLDL 40 50 60 70 80 90 190 200 210 220 230 pF1KE0 GH--PAPYGDLLMQSGGAASAPHL----HDYLNPVDVSRFSSPRVTPRLSRKRALSISPL : : : . ... . : : .. .: : :: : :.:::::.::: CCDS64 GDLLSLPPGTSMSSNSVSNSLPSYLFGTESSHSPYPSPRHSSTRSHSARSKKRALSLSPL 100 110 120 130 140 150 240 250 260 270 280 290 pF1KE0 SDA-SLDLQRMIRTSPNSLVAYINNSRSSSAASGS----YGHLSAGALSPAFTFPHPINP ::. ..:.. .:::::.:::::::.::.: : . :::. :. . . :.:. : CCDS64 SDGIGIDFNTIIRTSPTSLVAYINGSRASPANLSPQPEVYGHF-LGVRGSCIPQPRPV-P 160 170 180 190 200 210 300 310 320 330 340 pF1KE0 VAYQQILSQQRGLG-SAFGHTPPLIQPSPTFLAQQPMALTSINATPTQLS-----SSSNC . . .: ::. :.:. : . : . . .: .: . :.: CCDS64 GSQKGVLVAPGGLALPAYGEDGALEHERMQQLEHGGLQPGLVNHMVVQHGLPGPDSQSAG 220 230 240 250 260 270 350 360 370 380 390 400 pF1KE0 LSDTNQNKQSSESAVSSTVNPVAIHKRSKVKTEPEGLRPASPLALTQGQVSGHGSCGCAL : :.. .. :.:. : : :. : : : CCDS64 LFKTERLEEFPGSTVDLPPAP---------PLPPLPPPPGPPPPYHAHAHLHHPELG--- 280 290 300 310 410 420 430 440 450 460 pF1KE0 PLSQEQLADLKEDLDRDDCKQEAEVVIYETNCHWEDCTKEYDTQEQLVHHINNEHIHGEK : .: ::: . :: : : . . . :.: ::. :: ::.::.::.. :: .: CCDS64 PHAQ-QLALPQATLDDDG---EMDGIGGKHCCRWIDCSALYDQQEELVRHIEKVHIDQRK 320 330 340 350 360 370 470 480 490 500 510 520 pF1KE0 KE-FVCRWQACTREQKPFKAQYMLVVHMRRHTGEKPHKCTFEGCSKAYSRLENLKTHLRS : :.: : .: :. :::.:.: :..::: :.::::.::::::: ::.::::::: :::: CCDS64 GEDFTCFWAGCPRRYKPFNARYKLLIHMRVHSGEKPNKCTFEGCEKAFSRLENLKIHLRS 380 390 400 410 420 430 530 540 550 560 570 580 pF1KE0 HTGEKPYVCEHEGCNKAFSNASDRAKHQNRTHSNEKPYICKIPGCTKRYTDPSSLRKHVK :::::::.:.: ::.:::::.::::::: ::: . ::: :.::::::::::::::::::: CCDS64 HTGEKPYLCQHPGCQKAFSNSSDRAKHQ-RTHLDTKPYACQIPGCTKRYTDPSSLRKHVK 440 450 460 470 480 490 590 600 610 620 630 640 pF1KE0 TVHGPDAHVTKKQRNDVHLRTPLLKENGDSEAGTEPGGPESTEASST-SQAVEDCLHVRA . . . .. :: :....:. :: . .. .:... : .: ... . . CCDS64 AHSSKEQQARKKLRSSTELHPDLLTDCLTVQSLQPATSPRDAAAEGTVGRSPGPGPDLYS 500 510 520 530 540 550 650 660 670 680 690 700 pF1KE0 IKTESSGLCQSSPGAQSSCSSEPSPLGSAPNNDSGVEMPGTGPGS-LGDLTALDDTPPGA ::. . : :. .. : :. : :. .:. .:.: : :::.: :: CCDS64 APIFSSNYSSRS-GTAAGAVPPPHPV-SHPSPGHNVQGSPHNPSSQLPPLTAVD---AGA 560 570 580 590 600 710 720 730 740 750 760 pF1KE0 DTSALAAPSAGGLQLRKHMTTMHRFEQLKKEKLKSLKDSCSWAGPTPHTRNTKLPPLPGS . : .::: .. :. CCDS64 ERFAPSAPSPHHISPRRVPAPSSILQRTQPPYTQQPSGSHLKSYQPETNSSFQPNGIHVH 610 620 630 640 650 660 >>CCDS582.1 GLIS1 gene_id:148979|Hs108|chr1 (620 aa) initn: 653 init1: 483 opt: 775 Z-score: 399.6 bits: 85.4 E(32554): 6.1e-16 Smith-Waterman score: 810; 33.1% identity (54.2% similar) in 649 aa overlap (260-869:1-572) 230 240 250 260 270 280 pF1KE0 KRALSISPLSDASLDLQRMIRTSPNSLVAYINNSRSSSAASGSYGHLSAGALSPAFTFPH . ..:.: .: : :..: : : . .: CCDS58 MAEARTSLSAH-CRGPLATG-LHPDLDLPG 10 20 290 300 310 320 330 340 pF1KE0 P--INPVAYQQILSQQRGLGSAFGHTPPLIQPSPTFLAQQPMALTSINATPTQLSSSSNC .:. .:... . : .: : : .. ..: ::. .::: : CCDS58 RSLATPAPSCYLLGSEPSSG--LGLQPETHLPEGSLKRCCVLGLP-----PTSPASSSPC 30 40 50 60 70 80 350 360 370 380 pF1KE0 LS-DTNQNKQSSESAVSSTVN-----PVA-----IHKRSK---VKTEP-------EGLRP : :... .::.... . :: :.. ::.. ..:. :. : CCDS58 ASSDVTSIIRSSQTSLVTCVNGLRSPPLTGDLGGPSKRARPGPASTDSHEGSLQLEACRK 90 100 110 120 130 140 390 400 410 420 430 440 pF1KE0 ASPL----ALTQGQVSGHGSCGCALPLSQEQLADLKEDLDRDDCKQEAEVVIYETNCHWE :: : : ... : . : : :: .: ..:: . :.: CCDS58 ASFLKQEPADEFSELFGPHQQGLPPPYPLSQLPP-GPSLGGLGLGLAGRVVAGRQACRWV 150 160 170 180 190 200 450 460 470 480 490 500 pF1KE0 DCTKEYDTQEQLVHHINNEHIHGEKKE-FVCRWQACTREQKPFKAQYMLVVHMRRHTGEK :: :. ::.::.::.. :: .: : :.: : .:.:. :::.:.: :..::: :.::: CCDS58 DCCAAYEQQEELVRHIEKSHIDQRKGEDFTCFWAGCVRRYKPFNARYKLLIHMRVHSGEK 210 220 230 240 250 260 510 520 530 540 550 560 pF1KE0 PHKCTFEGCSKAYSRLENLKTHLRSHTGEKPYVCEHEGCNKAFSNASDRAKHQNRTHSNE :.:: :::::::.::::::: :::::::::::.:.: ::.:::::.::::::: ::: . CCDS58 PNKCMFEGCSKAFSRLENLKIHLRSHTGEKPYLCQHPGCQKAFSNSSDRAKHQ-RTHLDT 270 280 290 300 310 570 580 590 600 610 620 pF1KE0 KPYICKIPGCTKRYTDPSSLRKHVKTVHGPDAHVTKKQRNDVHLRTPLLKENGDSEAGTE ::: :.::::.:::::::::::::: :: .:.:. .: : CCDS58 KPYACQIPGCSKRYTDPSSLRKHVK------AHSAKEQQ----VRKKL------------ 320 330 340 350 630 640 650 660 670 680 pF1KE0 PGGPESTEASSTSQAVEDCLHVRAIKTESSGLCQSSPGAQSSCSSEPSPLGSAPNNDSGV .::. :::. .. .:: .. ..: :. : :. ....:. ::. CCDS58 HAGPD-TEAD----VLTECLVLQQLHT-STQLAASD--GKGGCG-----LGQE------- 360 370 380 390 690 700 710 720 730 pF1KE0 EMPGTGPGSLGDLTALDD--TPPGADTSALAAPSAGGLQLRKHMTTMHRFEQLKKEKLKS .::. :::. ..: . ::. :. . : . . ..:.. . : : CCDS58 LLPGVYPGSITPHNGLASGLLPPAHDVPSRHHPLDATTSSHHHLSPLPMAE--------S 400 410 420 430 440 740 750 760 770 780 790 pF1KE0 LKDSCSWAGPTPHTRNTKL---PPLPGSGSILENFSGSGGGGPAGLLPN-PRLSELSASE .:. . . .: . : :::: :.. : : :: : ::. : ... CCDS58 TRDGLGPGLLSPIVSPLKGLGPPPLPPSSQ-----SHSPGGQPFPTLPSKPSYPPFQSPP 450 460 470 480 490 500 800 810 820 830 840 850 pF1KE0 VTMLSQLQERRDSSTSTVSSAYTVSRRSSGISPYFSSRRSSEASPLG---AGRPH--NAS : . : . : : ..: . :: . : .: . : .:. : : CCDS58 PPPLPSPQGYQGSFHS-IQSCF----------PYGDCYRMAEPAAGGDGLVGETHGFNPL 510 520 530 540 550 860 870 880 890 900 910 pF1KE0 SADSYDPISTDASRRSSEASQCSGGSGLLNLTPAQQYSLRAKYAAATGGPPPTPLPGLER ..: .:: . :: CCDS58 RPNGYHSLSTPLPATGYEALAEASCPTALPQQPSEDVVSSGPEDCGFFPNGAFDHCLGHI 560 570 580 590 600 610 >>CCDS10511.1 GLIS2 gene_id:84662|Hs108|chr16 (524 aa) initn: 464 init1: 249 opt: 695 Z-score: 361.6 bits: 78.2 E(32554): 8e-14 Smith-Waterman score: 709; 36.5% identity (57.7% similar) in 381 aa overlap (423-784:154-506) 400 410 420 430 440 450 pF1KE0 TQGQVSGHGSCGCALPLSQEQLADLKEDLDRDDCKQEAEVVIYETNCHWEDCTKEYDTQE .: : . . . :.: :.. .. . CCDS10 DGVPSSFQFFLPLGSGGALHLPASSFLTPPKDKCLSPDLPLPKQLVCRWAKCNQLFELLQ 130 140 150 160 170 180 460 470 480 490 500 510 pF1KE0 QLVHHINNEHIHGEKKE-FVCRWQACTREQKPFKAQYMLVVHMRRHTGEKPHKCTFEGCS .:: :.:. :.. :: . :.:..:.:. . :.:.: ...:.: ::.::::.: :: CCDS10 DLVDHVNDYHVKPEKDAGYCCHWEGCARHGRGFNARYKMLIHIRTHTNEKPHRCPT--CS 190 200 210 220 230 240 520 530 540 550 560 570 pF1KE0 KAYSRLENLKTHLRSHTGEKPYVCEHEGCNKAFSNASDRAKHQNRTHSNEKPYICKIPGC :..::::::: : ::::::::::: .::::: .::.::: :: .::: .::: ::.::: CCDS10 KSFSRLENLKIHNRSHTGEKPYVCPYEGCNKRYSNSSDRFKH-TRTHYVDKPYYCKMPGC 250 260 270 280 290 300 580 590 600 610 620 630 pF1KE0 TKRYTDPSSLRKHVKTVHGPDAHVTKKQRNDVHLRTPLLKENGDSEAGTEPGGPESTEAS ::::::::::::.:. :: :...:.. ..:: : . ::: . : CCDS10 HKRYTDPSSLRKHIKA-HGH--FVSHEQQELLQLRPP-----PKPPLPAPDGGPYVSGA- 310 320 330 340 350 640 650 660 670 680 pF1KE0 STSQAVEDCLHVRAIKTESSGLCQSSPGAQSSCSSEPSPLGSAPNNDSGVEMPG--TGPG : . . : . :: :: . : :.. ...: : ::: CCDS10 ---QII---IPNPAALFGGPGL----PGLPLPLAPGPLDLSALACGNGGGSGGGGGMGPG 360 370 380 390 400 690 700 710 720 730 pF1KE0 SLGDLTALD-------DTPPGAD------TSALAAPSAG---GLQLRKHMTTMHRFEQLK : . :. .: :: .: ::. ..: : . : . : . . CCDS10 LPGPVLPLNLAKNPLLPSPFGAGGLGLPVVSLLAGAAGGKAEGEKGRGSVPTRALGMEGH 410 420 430 440 450 460 740 750 760 770 780 790 pF1KE0 KEKLKSLKDSCSWAGPTPHTRNTKLPPLPGSGSILENFSGSGGGGPAGLLPNPRLSELSA : :. ..::: :.: :: :::. : . .:....: .: : CCDS10 KTPLERTESSCSR--PSP----DGLPLLPGTVLDLSTGVNSAASSPEALAPGWVVIPPGS 470 480 490 500 510 800 810 820 830 840 850 pF1KE0 SEVTMLSQLQERRDSSTSTVSSAYTVSRRSSGISPYFSSRRSSEASPLGAGRPHNASSAD CCDS10 VLLKPAVVN 520 >>CCDS9495.1 ZIC2 gene_id:7546|Hs108|chr13 (532 aa) initn: 672 init1: 412 opt: 619 Z-score: 324.5 bits: 71.3 E(32554): 9.4e-12 Smith-Waterman score: 623; 37.9% identity (66.3% similar) in 285 aa overlap (431-697:250-523) 410 420 430 440 450 pF1KE0 GSCGCALPLSQEQLADLKEDLDRDDCKQEAEVVIYETNCHWED----------CTKEYDT . . : :.: : :.: ..: CCDS94 NMGMNMAAAAAHHHHHHHHHPGAFFRYMRQQCIKQELICKWIDPEQLSNPKKSCNKTFST 220 230 240 250 260 270 460 470 480 490 500 pF1KE0 QEQLVHHINNEHIHG-EKKEFVCRWQACTREQKPFKAQYMLVVHMRRHTGEKPHKCTFEG ...:: :.. ::. : :... :: :. : :: :::::.: :: :.: :::::: : : : CCDS94 MHELVTHVSVEHVGGPEQSNHVCFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPG 280 290 300 310 320 330 510 520 530 540 550 560 pF1KE0 CSKAYSRLENLKTHLRSHTGEKPYVCEHEGCNKAFSNASDRAKHQNRTHSNEKPYICKIP :.:...: :::: : :.::::::. :: :::.. :.:.::: ::.. .:...:::.::. CCDS94 CGKVFARSENLKIHKRTHTGEKPFQCEFEGCDRRFANSSDRKKHMH-VHTSDKPYLCKM- 340 350 360 370 380 390 570 580 590 600 610 620 pF1KE0 GCTKRYTDPSSLRKHVKTVH--GPD-AHVTKKQRNDVHLRTP--LLKENGDSEAGTE--P : : :: :::::::.: :: .:. .. . . . :: :.. ... ..... : CCDS94 -CDKSYTHPSSLRKHMK-VHESSPQGSESSPAASSGYESSTPPGLVSPSAEPQSSSNLSP 400 410 420 430 440 450 630 640 650 660 670 680 pF1KE0 GGPESTEASSTSQAVEDCLHVRAIKTESSGLCQSSPGAQSSCSSEPSPLGSAPNNDSGVE .. .. :.... :. . .: :. . :.: .: :...: .. :.: .. .: CCDS94 AAAAAAAAAAAAAAAVSAVH-RGGGSGSGGAGGGSGGGSGSGGGG----GGAGGGGGGSS 460 470 480 490 500 510 690 700 710 720 730 740 pF1KE0 MPGTGPGSLGDLTALDDTPPGADTSALAAPSAGGLQLRKHMTTMHRFEQLKKEKLKSLKD : : :. : ..: CCDS94 --GGGSGTAGGHSGLSSNFNEWYV 520 530 1586 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 01:53:13 2016 done: Sat Nov 5 01:53:14 2016 Total Scan time: 5.520 Total Display time: 0.610 Function used was FASTA [36.3.4 Apr, 2011]