FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7942, 245 aa 1>>>pF1KB7942 245 - 245 aa - 245 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6982+/-0.000842; mu= 14.5596+/- 0.052 mean_var=125.8861+/-26.123, 0's: 0 Z-trim(110.6): 190 B-trim: 7 in 1/50 Lambda= 0.114310 statistics sampled from 11493 (11718) to 11493 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.72), E-opt: 0.2 (0.36), width: 16 Scan time: 2.450 The best scores are: opt bits E(32554) CCDS1290.1 PRRX1 gene_id:5396|Hs108|chr1 ( 245) 1592 273.2 1.2e-73 CCDS1291.1 PRRX1 gene_id:5396|Hs108|chr1 ( 217) 1304 225.6 2.1e-59 CCDS6926.1 PRRX2 gene_id:51450|Hs108|chr9 ( 253) 877 155.3 3.7e-38 CCDS31451.1 PAX6 gene_id:5080|Hs108|chr11 ( 422) 356 69.6 3.8e-12 CCDS31452.1 PAX6 gene_id:5080|Hs108|chr11 ( 436) 356 69.6 3.9e-12 CCDS11972.1 RAX gene_id:30062|Hs108|chr18 ( 346) 353 69.0 4.7e-12 CCDS14215.1 ARX gene_id:170302|Hs108|chrX ( 562) 354 69.4 5.7e-12 CCDS2450.1 PAX3 gene_id:5077|Hs108|chr2 ( 403) 343 67.4 1.6e-11 CCDS2449.1 PAX3 gene_id:5077|Hs108|chr2 ( 407) 343 67.4 1.6e-11 CCDS3463.1 PHOX2B gene_id:8929|Hs108|chr4 ( 314) 341 67.0 1.7e-11 CCDS42826.1 PAX3 gene_id:5077|Hs108|chr2 ( 479) 343 67.5 1.8e-11 CCDS46522.1 PAX3 gene_id:5077|Hs108|chr2 ( 483) 343 67.5 1.8e-11 CCDS42825.1 PAX3 gene_id:5077|Hs108|chr2 ( 484) 343 67.5 1.8e-11 CCDS31468.1 ALX4 gene_id:60529|Hs108|chr11 ( 411) 342 67.3 1.8e-11 CCDS2448.1 PAX3 gene_id:5077|Hs108|chr2 ( 505) 343 67.5 1.9e-11 CCDS8214.1 PHOX2A gene_id:401|Hs108|chr11 ( 284) 336 66.1 2.9e-11 CCDS44388.2 DRGX gene_id:644168|Hs108|chr10 ( 263) 330 65.1 5.4e-11 >>CCDS1290.1 PRRX1 gene_id:5396|Hs108|chr1 (245 aa) initn: 1592 init1: 1592 opt: 1592 Z-score: 1436.0 bits: 273.2 E(32554): 1.2e-73 Smith-Waterman score: 1592; 100.0% identity (100.0% similar) in 245 aa overlap (1-245:1-245) 10 20 30 40 50 60 pF1KB7 MTSSYGHVLERQPALGGRLDSPGNLDTLQAKKNFSVSHLLDLEEAGDMVAAQADENVGEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MTSSYGHVLERQPALGGRLDSPGNLDTLQAKKNFSVSHLLDLEEAGDMVAAQADENVGEA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 GRSLLESPGLTSGSDTPQQDNDQLNSEEKKKRKQRRNRTTFNSSQLQALERVFERTHYPD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GRSLLESPGLTSGSDTPQQDNDQLNSEEKKKRKQRRNRTTFNSSQLQALERVFERTHYPD 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 AFVREDLARRVNLTEARVQVWFQNRRAKFRRNERAMLANKNASLLKSYSGDVTAVEQPIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 AFVREDLARRVNLTEARVQVWFQNRRAKFRRNERAMLANKNASLLKSYSGDVTAVEQPIV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 PRPAPRPTDYLSWGTASPYSAMATYSATCANNSPAQGINMANSIANLRLKAKEYSLQRNQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PRPAPRPTDYLSWGTASPYSAMATYSATCANNSPAQGINMANSIANLRLKAKEYSLQRNQ 190 200 210 220 230 240 pF1KB7 VPTVN ::::: CCDS12 VPTVN >>CCDS1291.1 PRRX1 gene_id:5396|Hs108|chr1 (217 aa) initn: 1304 init1: 1304 opt: 1304 Z-score: 1179.9 bits: 225.6 E(32554): 2.1e-59 Smith-Waterman score: 1304; 100.0% identity (100.0% similar) in 199 aa overlap (1-199:1-199) 10 20 30 40 50 60 pF1KB7 MTSSYGHVLERQPALGGRLDSPGNLDTLQAKKNFSVSHLLDLEEAGDMVAAQADENVGEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MTSSYGHVLERQPALGGRLDSPGNLDTLQAKKNFSVSHLLDLEEAGDMVAAQADENVGEA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 GRSLLESPGLTSGSDTPQQDNDQLNSEEKKKRKQRRNRTTFNSSQLQALERVFERTHYPD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GRSLLESPGLTSGSDTPQQDNDQLNSEEKKKRKQRRNRTTFNSSQLQALERVFERTHYPD 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 AFVREDLARRVNLTEARVQVWFQNRRAKFRRNERAMLANKNASLLKSYSGDVTAVEQPIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 AFVREDLARRVNLTEARVQVWFQNRRAKFRRNERAMLANKNASLLKSYSGDVTAVEQPIV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 PRPAPRPTDYLSWGTASPYSAMATYSATCANNSPAQGINMANSIANLRLKAKEYSLQRNQ ::::::::::::::::::: CCDS12 PRPAPRPTDYLSWGTASPYRSSSLPRCCLHEGLHNGF 190 200 210 >>CCDS6926.1 PRRX2 gene_id:51450|Hs108|chr9 (253 aa) initn: 868 init1: 492 opt: 877 Z-score: 798.5 bits: 155.3 E(32554): 3.7e-38 Smith-Waterman score: 878; 62.7% identity (78.7% similar) in 249 aa overlap (12-245:12-253) 10 20 30 40 50 pF1KB7 MTSSYGHVLERQPALG-GRLDSPGNL---DTLQAKKNFSVSHLLDLEE---AGDMVA--- .:::: : : : : ::.::::::::::::: :: ..: CCDS69 MDSAAAAFALDKPALGPGPPPPPPALGPGDCAQARKNFSVSHLLDLEEVAAAGRLAARPG 10 20 30 40 50 60 60 70 80 90 100 pF1KB7 AQADENVGEAGRSLLESPGLTSGSDTPQQDND----QLNSEEKKKRKQRRNRTTFNSSQL :.:. : :.: : : .:::.. ::.. .: :.:.:::::::::::::: CCDS69 ARAEAREG-AAR---EPSGGSSGSEAAPQDGECPSPGRGSAAKRKKKQRRNRTTFNSSQL 70 80 90 100 110 110 120 130 140 150 160 pF1KB7 QALERVFERTHYPDAFVREDLARRVNLTEARVQVWFQNRRAKFRRNERAMLANKNASLLK :::::::::::::::::::.:::::::.::::::::::::::::::::::::...::::: CCDS69 QALERVFERTHYPDAFVREELARRVNLSEARVQVWFQNRRAKFRRNERAMLASRSASLLK 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB7 SYSGDVTAVEQPIVPRPAPRPTDYLSWGTASPYSAMATYSATCANNSPAQ-GINMANSIA ::: .. :.:::..:::. ::::: ..::::.. :: ....:: :.::::::: CCDS69 SYSQEA-AIEQPVAPRPTALSPDYLSWTASSPYSTVPPYSP--GSSGPATPGVNMANSIA 180 190 200 210 220 230 230 240 pF1KB7 NLRLKAKEYSLQRNQVPTVN .:::::::.::...:::::: CCDS69 SLRLKAKEFSLHHSQVPTVN 240 250 >>CCDS31451.1 PAX6 gene_id:5080|Hs108|chr11 (422 aa) initn: 298 init1: 298 opt: 356 Z-score: 331.6 bits: 69.6 E(32554): 3.8e-12 Smith-Waterman score: 356; 38.2% identity (66.0% similar) in 191 aa overlap (66-245:181-365) 40 50 60 70 80 90 pF1KB7 VSHLLDLEEAGDMVAAQADENVGEAGRSLLESPGLTSGS-DTPQQDNDQLNSEEKKKRKQ :. : ...: .. .:.:. . . . ::: CCDS31 GQTGSWGTRPGWYPGTSVPGQPTQDGCQQQEGGGENTNSISSNGEDSDEAQMRLQLKRKL 160 170 180 190 200 210 100 110 120 130 140 150 pF1KB7 RRNRTTFNSSQLQALERVFERTHYPDAFVREDLARRVNLTEARVQVWFQNRRAKFRRNER .::::.:.. :..:::. ::::::::.:.:: :: ...: :::.::::.:::::.::.:. CCDS31 QRNRTSFTQEQIEALEKEFERTHYPDVFARERLAAKIDLPEARIQVWFSNRRAKWRREEK 220 230 240 250 260 270 160 170 180 190 200 pF1KB7 AMLANKNASLLKSY----SGDVTAVEQPIVPRPAPRPTDYLSWGTASPYSAMA---TYSA ..:: :. :. :.: ::: :.:. :.. .. :. . : :::: CCDS31 LRNQRRQASNTPSHIPISSSFSTSVYQPI-PQPTT-PVSSFTSGSMLGRTDTALTNTYSA 280 290 300 310 320 210 220 230 240 pF1KB7 TCANNSPAQGINMANSIAN---LRLKAKEYSLQRNQVPTVN : ...:::.. . ... :: . :.:: CCDS31 L----PPMPSFTMANNLPMQPPVPSQTSSYSCMLPTSPSVNGRSYDTYTPPHMQTHMNSQ 330 340 350 360 370 380 CCDS31 PMGTSGTTSTGLISPGVSVPVQVPGSEPDMSQYWPRLQ 390 400 410 420 >>CCDS31452.1 PAX6 gene_id:5080|Hs108|chr11 (436 aa) initn: 298 init1: 298 opt: 356 Z-score: 331.4 bits: 69.6 E(32554): 3.9e-12 Smith-Waterman score: 356; 38.2% identity (66.0% similar) in 191 aa overlap (66-245:195-379) 40 50 60 70 80 90 pF1KB7 VSHLLDLEEAGDMVAAQADENVGEAGRSLLESPGLTSGS-DTPQQDNDQLNSEEKKKRKQ :. : ...: .. .:.:. . . . ::: CCDS31 GQTGSWGTRPGWYPGTSVPGQPTQDGCQQQEGGGENTNSISSNGEDSDEAQMRLQLKRKL 170 180 190 200 210 220 100 110 120 130 140 150 pF1KB7 RRNRTTFNSSQLQALERVFERTHYPDAFVREDLARRVNLTEARVQVWFQNRRAKFRRNER .::::.:.. :..:::. ::::::::.:.:: :: ...: :::.::::.:::::.::.:. CCDS31 QRNRTSFTQEQIEALEKEFERTHYPDVFARERLAAKIDLPEARIQVWFSNRRAKWRREEK 230 240 250 260 270 280 160 170 180 190 200 pF1KB7 AMLANKNASLLKSY----SGDVTAVEQPIVPRPAPRPTDYLSWGTASPYSAMA---TYSA ..:: :. :. :.: ::: :.:. :.. .. :. . : :::: CCDS31 LRNQRRQASNTPSHIPISSSFSTSVYQPI-PQPTT-PVSSFTSGSMLGRTDTALTNTYSA 290 300 310 320 330 340 210 220 230 240 pF1KB7 TCANNSPAQGINMANSIAN---LRLKAKEYSLQRNQVPTVN : ...:::.. . ... :: . :.:: CCDS31 L----PPMPSFTMANNLPMQPPVPSQTSSYSCMLPTSPSVNGRSYDTYTPPHMQTHMNSQ 350 360 370 380 390 CCDS31 PMGTSGTTSTGLISPGVSVPVQVPGSEPDMSQYWPRLQ 400 410 420 430 >>CCDS11972.1 RAX gene_id:30062|Hs108|chr18 (346 aa) initn: 440 init1: 319 opt: 353 Z-score: 329.9 bits: 69.0 E(32554): 4.7e-12 Smith-Waterman score: 356; 40.7% identity (66.7% similar) in 162 aa overlap (67-218:112-270) 40 50 60 70 80 90 pF1KB7 SHLLDLEEAGDMVAAQADENVGEAGRSLLESPGLTSGSDTPQQDNDQLNSEEKKKRKQRR :::: : : . .:. ::. :.:.:: CCDS11 EPSPPPAPAPAPEYEAPRPYCPKEPGEARPSPGLPVG---PATGEAKLSEEEQPKKKHRR 90 100 110 120 130 100 110 120 130 140 150 pF1KB7 NRTTFNSSQLQALERVFERTHYPDAFVREDLARRVNLTEARVQVWFQNRRAKFRRNERAM :::::.. ::. :::.::..::::.. ::.:: .::: :.::::::::::::.::.:. CCDS11 NRTTFTTYQLHELERAFEKSHYPDVYSREELAGKVNLPEVRVQVWFQNRRAKWRRQEKLE 140 150 160 170 180 190 160 170 180 190 200 pF1KB7 LAN---KNASLLKSYSGDVTAVEQPIV--PR----PAPRPTDYLSW-GTASPYSAMATYS ... ... ::. . .:. .:. : :: :: : : .. .. . CCDS11 VSSMKLQDSPLLSFSRSPPSATLSPLGAGPGSGGGPAGGALPLESWLGPPLPGGGATALQ 200 210 220 230 240 250 210 220 230 240 pF1KB7 ATCANNSPAQGINMANSIANLRLKAKEYSLQRNQVPTVN . . . :::.. CCDS11 SLPGFGPPAQSLPASYTPPPPPPPFLNSPPLGPGLQPLAPPPPSYPCGPGFGDKFPLDEA 260 270 280 290 300 310 >>CCDS14215.1 ARX gene_id:170302|Hs108|chrX (562 aa) initn: 376 init1: 323 opt: 354 Z-score: 328.3 bits: 69.4 E(32554): 5.7e-12 Smith-Waterman score: 354; 40.3% identity (62.2% similar) in 196 aa overlap (46-229:272-462) 20 30 40 50 60 70 pF1KB7 GGRLDSPGNLDTLQAKKNFSVSHLLDLEEAGDMVAAQADENVGEAGR-----SLLESPGL : ..:: : . :.:. :: : CCDS14 ELLEDDEEELLEDDARALLKEPRRCPVAATGAVAAAAAAAVATEGGELSPKEELLLHPED 250 260 270 280 290 300 80 90 100 110 120 pF1KB7 TSGSDTPQQDNDQL----NSEEKK-KRKQRRNRTTFNSSQLQALERVFERTHYPDAFVRE . :.: .:. : .::: :::::: ::::.: ::. :::.:..:::::.:.:: CCDS14 AEGKDG--EDSVCLSAGSDSEEGLLKRKQRRYRTTFTSYQLEELERAFQKTHYPDVFTRE 310 320 330 340 350 130 140 150 160 170 180 pF1KB7 DLARRVNLTEARVQVWFQNRRAKFRRNERAMLANKNASLLKSYSGDVTAVEQPIVPR--P .:: :..::::::::::::::::.:. :.: .. .: . : ..:. .:. : CCDS14 ELAMRLDLTEARVQVWFQNRRAKWRKREKAGAQTHPPGL--PFPGPLSAT-HPLSPYLDA 360 370 380 390 400 410 190 200 210 220 230 240 pF1KB7 APRPTDYLSWGTASPYSAMATYSATCANNSPAQGINMANSIANLRLKAKEYSLQRNQVPT .: : . . .: .: :. .: . : . .. : : : : CCDS14 SPFPPHHPALDSAWTAAAAAAAAAFPSLPPPPGSASLPPSGAPLGLSTFLGAAVFRHPAF 420 430 440 450 460 470 pF1KB7 VN CCDS14 ISPAFGRLFSTMAPLTSASTAAALLRQPTPAVEGAVASGALADPATAAADRRASSIAALR 480 490 500 510 520 530 >>CCDS2450.1 PAX3 gene_id:5077|Hs108|chr2 (403 aa) initn: 304 init1: 304 opt: 343 Z-score: 320.2 bits: 67.4 E(32554): 1.6e-11 Smith-Waterman score: 343; 39.4% identity (67.4% similar) in 175 aa overlap (43-214:167-333) 20 30 40 50 60 70 pF1KB7 PALGGRLDSPGNLDTLQAKKNFSVSHLLDLEEAGDMVAAQADENVGEAGRSLLESPGLTS :: .:. .:.:. .: .:. . :. CCDS24 LLKDAVCDRNTVPSVSSISRILRSKFGKGEEEEADLERKEAEESEKKAKHSI--DGILSE 140 150 160 170 180 190 80 90 100 110 120 pF1KB7 GSDTPQQDN-DQLNSEEKK--KRKQRRNRTTFNSSQLQALERVFERTHYPDAFVREDLAR ...::.:. ....:: ::::::.::::.. ::. :::.:::::::: ..::.::. CCDS24 RASAPQSDEGSDIDSEPDLPLKRKQRRSRTTFTAEQLEELERAFERTHYPDIYTREELAQ 200 210 220 230 240 250 130 140 150 160 170 180 pF1KB7 RVNLTEARVQVWFQNRRAKFRRNERAMLANKNASLLKSYSGDVTAVEQPIVPRPAPRPTD :..::::::::::.::::..:.. ::. .. . : . .: .: :. CCDS24 RAKLTEARVQVWFSNRRARWRKQAG---ANQLMAFNHLIPGGFPPTAMPTLPTYQLSETS 260 270 280 290 300 310 190 200 210 220 230 240 pF1KB7 YLSWGTASPYSAMATYSATCANNSPAQGINMANSIANLRLKAKEYSLQRNQVPTVN : :. : .:.. :.: .: CCDS24 YQP--TSIP-QAVSDPSSTVHRPQPLPPSTVHQSTIPSNPDSSSAYCLPSTRHGFSSYTD 320 330 340 350 360 >>CCDS2449.1 PAX3 gene_id:5077|Hs108|chr2 (407 aa) initn: 304 init1: 304 opt: 343 Z-score: 320.2 bits: 67.4 E(32554): 1.6e-11 Smith-Waterman score: 343; 39.4% identity (67.4% similar) in 175 aa overlap (43-214:167-333) 20 30 40 50 60 70 pF1KB7 PALGGRLDSPGNLDTLQAKKNFSVSHLLDLEEAGDMVAAQADENVGEAGRSLLESPGLTS :: .:. .:.:. .: .:. . :. CCDS24 LLKDAVCDRNTVPSVSSISRILRSKFGKGEEEEADLERKEAEESEKKAKHSI--DGILSE 140 150 160 170 180 190 80 90 100 110 120 pF1KB7 GSDTPQQDN-DQLNSEEKK--KRKQRRNRTTFNSSQLQALERVFERTHYPDAFVREDLAR ...::.:. ....:: ::::::.::::.. ::. :::.:::::::: ..::.::. CCDS24 RASAPQSDEGSDIDSEPDLPLKRKQRRSRTTFTAEQLEELERAFERTHYPDIYTREELAQ 200 210 220 230 240 250 130 140 150 160 170 180 pF1KB7 RVNLTEARVQVWFQNRRAKFRRNERAMLANKNASLLKSYSGDVTAVEQPIVPRPAPRPTD :..::::::::::.::::..:.. ::. .. . : . .: .: :. CCDS24 RAKLTEARVQVWFSNRRARWRKQAG---ANQLMAFNHLIPGGFPPTAMPTLPTYQLSETS 260 270 280 290 300 310 190 200 210 220 230 240 pF1KB7 YLSWGTASPYSAMATYSATCANNSPAQGINMANSIANLRLKAKEYSLQRNQVPTVN : :. : .:.. :.: .: CCDS24 YQP--TSIP-QAVSDPSSTVHRPQPLPPSTVHQSTIPSNPDSSSAYCLPSTRHGFSSYTD 320 330 340 350 360 >>CCDS3463.1 PHOX2B gene_id:8929|Hs108|chr4 (314 aa) initn: 334 init1: 334 opt: 341 Z-score: 319.7 bits: 67.0 E(32554): 1.7e-11 Smith-Waterman score: 341; 48.4% identity (68.0% similar) in 128 aa overlap (90-217:94-216) 60 70 80 90 100 110 pF1KB7 AGRSLLESPGLTSGSDTPQQDNDQLNSEEKKKRKQRRNRTTFNSSQLQALERVFERTHYP .:::::: ::::.:.::. ::::: .:::: CCDS34 SCSLGTLRDHQSSPYAAVPYKLFTDHGGLNEKRKQRRIRTTFTSAQLKELERVFAETHYP 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB7 DAFVREDLARRVNLTEARVQVWFQNRRAKFRRNERAMLANKNASLLKSYSGDVTAVEQPI : ..::.:: ...::::::::::::::::::..::: : :. : :: . . CCDS34 DIYTREELALKIDLTEARVQVWFQNRRAKFRKQERAAAAAAAAAKNGS-SGKKSDSSRDD 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB7 VPRPAPRPTDYLSWGTASPYSAMATYSATCANNSPAQGINMANSIANLRLKAKEYSLQRN . : . :: : : .: . . .:. :. . : CCDS34 ESKEA-KSTDPDSTGGPGP---NPNPTPSCGANGGGGGGPSPAGAPGAAGPGGPGGEPGK 190 200 210 220 230 240 pF1KB7 QVPTVN CCDS34 GGAAAAAAAAAAAAAAAAAAAAGGLAAAGGPGQGWAPGPGPITSIPDSLGGPFASVLSSL 240 250 260 270 280 290 245 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 10:14:02 2016 done: Sat Nov 5 10:14:02 2016 Total Scan time: 2.450 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]