FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDB0028, 555 aa 1>>>pF1KSDB0028 555 - 555 aa - 555 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 11.0949+/- 0.001; mu= -6.5389+/- 0.060 mean_var=315.7260+/-64.401, 0's: 0 Z-trim(114.6): 24 B-trim: 0 in 0/51 Lambda= 0.072180 statistics sampled from 15163 (15174) to 15163 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.771), E-opt: 0.2 (0.466), width: 16 Scan time: 3.930 The best scores are: opt bits E(32554) CCDS607.1 DAB1 gene_id:1600|Hs108|chr1 ( 555) 3726 401.6 1.3e-111 CCDS58946.1 DAB2 gene_id:1601|Hs108|chr5 ( 749) 753 92.0 2.6e-18 CCDS34149.1 DAB2 gene_id:1601|Hs108|chr5 ( 770) 746 91.3 4.5e-18 >>CCDS607.1 DAB1 gene_id:1600|Hs108|chr1 (555 aa) initn: 3726 init1: 3726 opt: 3726 Z-score: 2117.1 bits: 401.6 E(32554): 1.3e-111 Smith-Waterman score: 3726; 100.0% identity (100.0% similar) in 555 aa overlap (1-555:1-555) 10 20 30 40 50 60 pF1KSD MSTETELQVAVKTSAKKDSRKKGQDRSEATLIKRFKGEGVRYKAKLIGIDEVSAARGDKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 MSTETELQVAVKTSAKKDSRKKGQDRSEATLIKRFKGEGVRYKAKLIGIDEVSAARGDKL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD CQDSMMKLKGVVAGARSKGEHKQKIFLTISFGGIKIFDEKTGALQHHHAVHEISYIAKDI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 CQDSMMKLKGVVAGARSKGEHKQKIFLTISFGGIKIFDEKTGALQHHHAVHEISYIAKDI 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD TDHRAFGYVCGKEGNHRFVAIKTAQAAEPVILDLRDLFQLIYELKQREELEKKAQKDKQC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 TDHRAFGYVCGKEGNHRFVAIKTAQAAEPVILDLRDLFQLIYELKQREELEKKAQKDKQC 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD EQAVYQTILEEDVEDPVYQYIVFEAGHEPIRDPETEENIYQVPTSQKKEGVYDVPKSQPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 EQAVYQTILEEDVEDPVYQYIVFEAGHEPIRDPETEENIYQVPTSQKKEGVYDVPKSQPV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD SAVTQLELFGDMSTPPDITSPPTPATPGDAFIPSSSQTLPASADVFSSVPFGTAAVPSGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 SAVTQLELFGDMSTPPDITSPPTPATPGDAFIPSSSQTLPASADVFSSVPFGTAAVPSGY 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD VAMGAVLPSFWGQQPLVQQQMVMGAQPPVAQVMPGAQPIAWGQPGLFPATQQPWPTVAGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 VAMGAVLPSFWGQQPLVQQQMVMGAQPPVAQVMPGAQPIAWGQPGLFPATQQPWPTVAGQ 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD FPPAAFMPTQTVMPLPAAMFQGPLTPLATVPGTSDSTRSSPQTDKPRQKMGKETFKDFQM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 FPPAAFMPTQTVMPLPAAMFQGPLTPLATVPGTSDSTRSSPQTDKPRQKMGKETFKDFQM 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD AQPPPVPSRKPDQPSLTCTSEAFSSYFNKVGVAQDTDDCDDFDISQLNLTPVTSTTPSTN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 AQPPPVPSRKPDQPSLTCTSEAFSSYFNKVGVAQDTDDCDDFDISQLNLTPVTSTTPSTN 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD SPPTPAPRQSSPSKSSASHASDPTTDDIFEEGFESPSKSEEQEAPDGSQASSNSDPFGEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 SPPTPAPRQSSPSKSSASHASDPTTDDIFEEGFESPSKSEEQEAPDGSQASSNSDPFGEP 490 500 510 520 530 540 550 pF1KSD SGEPSGDNISPQAGS ::::::::::::::: CCDS60 SGEPSGDNISPQAGS 550 >>CCDS58946.1 DAB2 gene_id:1601|Hs108|chr5 (749 aa) initn: 964 init1: 701 opt: 753 Z-score: 442.1 bits: 92.0 E(32554): 2.6e-18 Smith-Waterman score: 764; 31.5% identity (58.2% similar) in 596 aa overlap (4-551:13-579) 10 20 30 40 50 pF1KSD MSTETELQVAVKTSAKKDSRKKGQDRSEATLIKRFKGEGVRYKAKLIGIDE . . :.: :. .::. .::: .... :. ::::.::.:::::::::. CCDS58 MSNEVETSATNGQPDQQAAPKAPSKKE-KKKGPEKTDEYLLARFKGDGVKYKAKLIGIDD 10 20 30 40 50 60 70 80 90 100 110 pF1KSD VSAARGDKLCQDSMMKLKGVVAGARSKGEHKQKIFLTISFGGIKIFDEKTGALQHHHAVH : :::::. :::::::::..:..::.:.:::.:...::..::::.:::::...:.: :. CCDS58 VPDARGDKMSQDSMMKLKGMAAAGRSQGQHKQRIWVNISLSGIKIIDEKTGVIEHEHPVN 60 70 80 90 100 110 120 130 140 150 160 170 pF1KSD EISYIAKDITDHRAFGYVCGKEGNHRFVAIKTAQAAEPVILDLRDLFQLIYELKQREELE .::.::.:.::.:::::::: ::.:.: ::::.: :::...::.::::.::..:..:: . CCDS58 KISFIARDVTDNRAFGYVCGGEGQHQFFAIKTGQQAEPLVVDLKDLFQVIYNVKKKEEEK 120 130 140 150 160 170 180 190 200 210 220 pF1KSD KKAQK-DKQCEQAVYQTILEEDVEDPVYQYIVFEAGHEPIRDPETEENIYQVPTSQKK-- :: .. .: :.. .. .: . . . :. . : ..: . : .. CCDS58 KKIEEASKAVENGSEALMILDDQTNKLKS----ESKDILLVDLNSEIDTNQNSLRENPFL 180 190 200 210 220 230 230 240 250 260 270 280 pF1KSD -EGVYD--VPKSQPVSAVTQLELFG-DMSTPPDITSPP---TPATPGDAFIPSSSQTLPA .:. . .:. : .. . :. ... : . : : : : ::: ..: . CCDS58 TNGITSCSLPRPTPQASFLPENAFSANLNFFPTPNPDPFRDDPFTQPDQSTPSSFDSLKS 240 250 260 270 280 290 290 300 310 320 330 pF1KSD SADVFSSVPFGTAAVPSGYVAMGAVLPSFWGQQPLVQQQMVMGAQPPVAQVMP----GAQ . . ... . .: . : : ...::: . : . : : : : .: CCDS58 PDQKKENSSSSSTPLSNGPLN-GDV--DYFGQQ-FDQISNRTGKQEAQAGPWPFSSSQTQ 300 310 320 330 340 350 340 350 360 370 380 390 pF1KSD PIAWGQPGL-------FPATQQPWPTVAGQFPPAAFMPTQTVMPLPAAMFQGPLTPLATV : . : :. : . ..: : : :. : . . . . . : ... ..: .: . CCDS58 PAVRTQNGVSEREQNGFSVKSSPNPFV-GSPPKGLSIQNGVKQDLESSVQSSPHDSIAII 360 370 380 390 400 410 400 410 420 430 440 pF1KSD PGTSDSTRSSPQTDKPRQ--KMGKETFKDFQMAQ--PPPVPSRKPDQPSLTCTSEAFSSY : ::. :: . . .: . .:. .. ::: :. : : : :.. CCDS58 P--------PPQSTKPGRGRRTAKSSANDLLASDIFAPPV-SEPSGQASPTGQPTALQP- 420 430 440 450 460 450 460 470 480 490 pF1KSD FNKVGVAQDTDDCDDFDISQL-NLTPVTSTTPST----------NSPPTPAPRQ---SSP : . . . . .. : .: :: : :.. :. :. :: ..: CCDS58 -NPLDLFKTSAPAP---VGPLVGLGGVTVTLPQAGPWNTASLVFNQSPSMAPGAMMGGQP 470 480 490 500 510 500 510 520 530 540 pF1KSD SKSSAS--HASDPTTDDIFEEGFESPSKSEEQEAPD-----GSQASSNSDPFGE--PSGE : : ...:... :...:: . : : .:: . .. : :. CCDS58 SGFSQPVIFGTSPAVS-----GWNQPSPFAASTPPPVPVVWGPSASVAPNAWSTTSPLGN 520 530 540 550 560 570 550 pF1KSD PSGDNISPQAGS : .:: : CCDS58 PFQSNIFPAPAVSTQPPSMHSSLLVTPPQPPPRAGPPKDISSDAFTALDPLGDKEIKDVK 580 590 600 610 620 630 >>CCDS34149.1 DAB2 gene_id:1601|Hs108|chr5 (770 aa) initn: 1062 init1: 701 opt: 746 Z-score: 438.0 bits: 91.3 E(32554): 4.5e-18 Smith-Waterman score: 808; 32.7% identity (57.0% similar) in 575 aa overlap (4-554:13-512) 10 20 30 40 50 pF1KSD MSTETELQVAVKTSAKKDSRKKGQDRSEATLIKRFKGEGVRYKAKLIGIDE . . :.: :. .::. .::: .... :. ::::.::.:::::::::. CCDS34 MSNEVETSATNGQPDQQAAPKAPSKKE-KKKGPEKTDEYLLARFKGDGVKYKAKLIGIDD 10 20 30 40 50 60 70 80 90 100 110 pF1KSD VSAARGDKLCQDSMMKLKGVVAGARSKGEHKQKIFLTISFGGIKIFDEKTGALQHHHAVH : :::::. :::::::::..:..::.:.:::.:...::..::::.:::::...:.: :. CCDS34 VPDARGDKMSQDSMMKLKGMAAAGRSQGQHKQRIWVNISLSGIKIIDEKTGVIEHEHPVN 60 70 80 90 100 110 120 130 140 150 160 170 pF1KSD EISYIAKDITDHRAFGYVCGKEGNHRFVAIKTAQAAEPVILDLRDLFQLIYELKQREELE .::.::.:.::.:::::::: ::.:.: ::::.: :::...::.::::.::..:..:: . CCDS34 KISFIARDVTDNRAFGYVCGGEGQHQFFAIKTGQQAEPLVVDLKDLFQVIYNVKKKEEEK 120 130 140 150 160 170 180 190 200 210 220 230 pF1KSD KKAQKDKQCEQAVYQTILEEDVEDPVYQYIVFEAGHEPIRDPETEENIYQVPTSQKKEGV :: . . .:: : : : . : . :.. : :: CCDS34 KKIE---EASKAV-------------------ENGSEAL-------MILDDQTNKLKSGV 180 190 200 210 240 250 260 270 280 290 pF1KSD YDVPKSQPVSAVTQLELFGDMSTPPDITSPPTPATPGDAFIPSSSQTLPASADVFSSVPF :..::::::::::..:: . : .. . .. . .. . . :: CCDS34 ------------DQMDLFGDMSTPPDLNSP---TESKDILLVDLNSEIDTNQNSLRENPF 220 230 240 250 300 310 320 330 340 350 pF1KSD GTAAVPSGYVAMGAVLPSFWGQQPLVQQQMVMGAQPPVAQVMPGAQPIAWGQPGLFPATQ : .. : :: .: : ... : : .:. . :. : . CCDS34 LTNGITS------CSLP-----RPTPQASFL----PENA---FSANLNFFPTPNPDPFRD 260 270 280 290 360 370 380 390 400 410 pF1KSD QPWPTVAGQFPPAAFMPTQTVMP-LPAAMFQGPLTPLATVPGTSDSTRSSPQTDKPRQKM .:. : : :..: .. : .. :::.. : ..: . : :. .. CCDS34 DPF-TQPDQSTPSSFDSLKS--PDQKKENSSSSSTPLSNGPLNGDVDYFGQQFDQISNRT 300 310 320 330 340 350 420 430 440 450 460 pF1KSD GKETFKDFQMAQPPPVP-SRKPDQPSLTCTSEAFSSYFNKVGVAQDTDDC-----DDFDI :: : :: : : : . ::.. . . : .: .. . ..: CCDS34 GK------QEAQAGPWPFSSSQTQPAVRTQNGVSEREQNGFSVKSSPNPFVGSPPKGLSI 360 370 380 390 400 470 480 490 500 510 pF1KSD S---QLNLTPVTSTTPSTNSPPTPAPRQSSPSK---SSASHASDPTTDDIFEEGFESPSK . . .: ....: . : :....:.. .. : :.: ..::: :: CCDS34 QNGVKQDLESSVQSSPHDSIAIIPPPQSTKPGRGRRTAKSSANDLLASDIFAPPVSEPSG 410 420 430 440 450 460 520 530 540 550 pF1KSD SEEQEAPDGSQASSNSDP---FGEPSGEPSGDNIS--------PQAGS : .: :. .. . .: : . : : .. :::: CCDS34 ---QASPTGQPTALQPNPLDLFKTSAPAPVGPLVGLGGVTVTLPQAGPWNTASLVFNQSP 470 480 490 500 510 520 CCDS34 SMAPGAMMGGQPSGFSQPVIFGTSPAVSGWNQPSPFAASTPPPVPVVWGPSASVAPNAWS 530 540 550 560 570 580 555 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 08:09:54 2016 done: Thu Nov 3 08:09:55 2016 Total Scan time: 3.930 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]