FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB3347, 737 aa 1>>>pF1KB3347 737 - 737 aa - 737 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.4274+/-0.00106; mu= 1.5188+/- 0.064 mean_var=211.0187+/-42.402, 0's: 0 Z-trim(110.7): 19 B-trim: 58 in 1/52 Lambda= 0.088290 statistics sampled from 11804 (11810) to 11804 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.704), E-opt: 0.2 (0.363), width: 16 Scan time: 3.350 The best scores are: opt bits E(32554) CCDS31021.1 PROX1 gene_id:5629|Hs108|chr1 ( 737) 4916 639.4 5.8e-183 CCDS73663.1 PROX2 gene_id:283571|Hs108|chr14 ( 592) 835 119.5 1.5e-26 CCDS45136.2 PROX2 gene_id:283571|Hs108|chr14 ( 365) 607 90.4 5.5e-18 >>CCDS31021.1 PROX1 gene_id:5629|Hs108|chr1 (737 aa) initn: 4916 init1: 4916 opt: 4916 Z-score: 3398.2 bits: 639.4 E(32554): 5.8e-183 Smith-Waterman score: 4916; 100.0% identity (100.0% similar) in 737 aa overlap (1-737:1-737) 10 20 30 40 50 60 pF1KB3 MPDHDSTALLSRQTKRRRVDIGVKRTVGTASAFFAKARATFFSAMNPQGSEQDVEYSVVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MPDHDSTALLSRQTKRRRVDIGVKRTVGTASAFFAKARATFFSAMNPQGSEQDVEYSVVQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 HADGEKSNVLRKLLKRANSYEDAMMPFPGATIISQLLKNNMNKNGGTEPSFQASGLSSTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 HADGEKSNVLRKLLKRANSYEDAMMPFPGATIISQLLKNNMNKNGGTEPSFQASGLSSTG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 SEVHQEDICSNSSRDSPPECLSPFGRPTMSQFDMDRLCDEHLRAKRARVENIIRGMSHSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SEVHQEDICSNSSRDSPPECLSPFGRPTMSQFDMDRLCDEHLRAKRARVENIIRGMSHSP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 SVALRGNENEREMAPQSVSPRESYRENKRKQKLPQQQQQSFQQLVSARKEQKREERRQLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SVALRGNENEREMAPQSVSPRESYRENKRKQKLPQQQQQSFQQLVSARKEQKREERRQLK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB3 QQLEDMQKQLRQLQEKFYQIYDSTDSENDEDGNLSEDSMRSEILDARAQDSVGRSDNEMC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 QQLEDMQKQLRQLQEKFYQIYDSTDSENDEDGNLSEDSMRSEILDARAQDSVGRSDNEMC 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB3 ELDPGQFIDRARALIREQEMAENKPKREGNNKERDHGPNSLQPEGKHLAETLKQELNTAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 ELDPGQFIDRARALIREQEMAENKPKREGNNKERDHGPNSLQPEGKHLAETLKQELNTAM 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB3 SQVVDTVVKVFSAKPSRQVPQVFPPLQIPQARFAVNGENHNFHTANQRLQCFGDVIIPNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SQVVDTVVKVFSAKPSRQVPQVFPPLQIPQARFAVNGENHNFHTANQRLQCFGDVIIPNP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB3 LDTFGNVQMASSTDQTEALPLVVRKNSSDQSASGPAAGGHHQPLHQSPLSATTGFTTSTF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LDTFGNVQMASSTDQTEALPLVVRKNSSDQSASGPAAGGHHQPLHQSPLSATTGFTTSTF 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB3 RHPFPLPLMAYPFQSPLGAPSGSFSGKDRASPESLDLTRDTTSLRTKMSSHHLSHHPCSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 RHPFPLPLMAYPFQSPLGAPSGSFSGKDRASPESLDLTRDTTSLRTKMSSHHLSHHPCSP 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB3 AHPPSTAEGLSLSLIKSECGDLQDMSEISPYSGSAMQEGLSPNHLKKAKLMFFYTRYPSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 AHPPSTAEGLSLSLIKSECGDLQDMSEISPYSGSAMQEGLSPNHLKKAKLMFFYTRYPSS 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB3 NMLKTYFSDVKFNRCITSQLIKWFSNFREFYYIQMEKYARQAINDGVTSTEELSITRDCE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 NMLKTYFSDVKFNRCITSQLIKWFSNFREFYYIQMEKYARQAINDGVTSTEELSITRDCE 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB3 LYRALNMHYNKANDFEVPERFLEVAQITLREFFNAIIAGKDVDPSWKKAIYKVICKLDSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LYRALNMHYNKANDFEVPERFLEVAQITLREFFNAIIAGKDVDPSWKKAIYKVICKLDSE 670 680 690 700 710 720 730 pF1KB3 VPEIFKSPNCLQELLHE ::::::::::::::::: CCDS31 VPEIFKSPNCLQELLHE 730 >>CCDS73663.1 PROX2 gene_id:283571|Hs108|chr14 (592 aa) initn: 1077 init1: 798 opt: 835 Z-score: 590.2 bits: 119.5 E(32554): 1.5e-26 Smith-Waterman score: 1094; 37.7% identity (59.9% similar) in 626 aa overlap (124-727:17-587) 100 110 120 130 140 pF1KB3 SQLLKNNMNKNGGTEPSFQASGLSSTGSEVHQEDICSNSSRDSPPECL---SPFGR---P : . :... :.: : : ::: : CCDS73 MDPNSILLSPQPQICSHLAEACTEGERSSSPPELDRDSPFPWSQVP 10 20 30 40 150 160 170 180 190 200 pF1KB3 TMSQFDMDRLCDEHLRAKRARVENIIRGMSHSPSVALRGNENEREMAPQSVSPR--ESYR . : : . . :::..:::::::.:.::: ::. . :: : .:::: .. : CCDS73 SSSPTDPEWFGDEHIQAKRARVETIVRGMCLSPNPLVPGN------AQAGVSPRCPKKAR 50 60 70 80 90 100 210 220 230 240 250 260 pF1KB3 ENKRKQKLPQQQQQSFQQLVSARKEQKREERRQLKQQLEDMQKQLRQLQEKFYQIYDSTD : ::::.:: : .. . . : . .:. ....::. ...:::.:::.. : : CCDS73 ERKRKQNLPTPQ--GLLMPAPAWDQGNRKGGPRVREQLHLLKQQLRHLQEHILQAAKPRD 110 120 130 140 150 270 280 290 300 310 320 pF1KB3 SENDEDGNLSEDSMRSEILDARAQDSVGRSDNEMCELDPGQFIDRARALIREQEMAENKP . . : . . :.:. .. : : : . . . .. CCDS73 TAQGPGGCGTGKGP----LSAKQGNGCG----------P-------RPWVVDGDHQQGTS 160 170 180 190 330 340 350 360 370 380 pF1KB3 KR-EGNNKERDHGPNSLQPEGKHLA-ETLKQELNTAMSQVVDTVV-KVFSAKPSR--QVP : : .:... :. : : . : :..::. :.::.::.:. ::. :.. :. CCDS73 KDLSGAEKHQESEKPSFLPSGAPASLEILRKELTRAVSQAVDSVLQKVLLDPPGHLTQLG 200 210 220 230 240 250 390 400 410 420 430 pF1KB3 QVFPPLQIPQARFA----VNGENHN---FHTANQRLQCFGDVIIPNPLDTFGNVQMASST . : :. ..: :.: .. . . .:.: . : :. ::...:. CCDS73 RSFQG-QVAEGRSEPSPPVGGACKDPLALAALPRRVQLQAGV----PV---GNLSLAKRL 260 270 280 290 300 440 450 460 470 480 490 pF1KB3 DQTE--ALPLVVRKNSSDQSASGPAAGGHHQPLHQSPLSATTGFTTSTFRHPFPLPLMAY :. . : .. : .: :. : .. : .: :: : .. . : . CCDS73 DSPRYPIPPRMTPKPCQDPPANFPLTAPSHIQENQI-LSQLLGHRYNNGHWSSSPPQDSS 310 320 330 340 350 360 500 510 520 530 540 550 pF1KB3 PFQSPLGAPSGSFSGKDRASPESLDLTRDTTSLRTKMSSHHLSHHPCSPAHPPSTAEGLS . : . : .. ..:. : :... : ..: :: : :. CCDS73 SQRHPSSEP--ALRPWRTTKPQPLVLSQQQCPL--PFTSAHLESLPLLPS---------- 370 380 390 400 410 560 570 580 590 600 610 pF1KB3 LSLIKSECGDLQDMSEISPYSGSAMQEGLSPNHLKKAKLMFFYTRYPSSNMLKTYFSDVK .: : :. . : :.: .::::.:.::::::::::.:::::::.::.:: ::. CCDS73 ---VKMEQRGLHAVMEALPFSLVHIQEGLNPGHLKKAKLMFFFTRYPSSNLLKVYFPDVQ 420 430 440 450 460 470 620 630 640 650 660 670 pF1KB3 FNRCITSQLIKWFSNFREFYYIQMEKYARQAINDGVTSTEELSITRDCELYRALNMHYNK ::::::::.::::::::::::::::: :::::.::::. . : . :. ::..:::::::: CCDS73 FNRCITSQMIKWFSNFREFYYIQMEKSARQAISDGVTNPKMLVVLRNSELFQALNMHYNK 480 490 500 510 520 530 680 690 700 710 720 730 pF1KB3 ANDFEVPERFLEVAQITLREFFNAIIAGKDVDPSWKKAIYKVICKLDSEVPEIFKSPNCL .::::::. :::.:..::.::: :. ::.: :::::: :::.: ::::..:::::: CCDS73 GNDFEVPDCFLEIASLTLQEFFRAVSAGRDSDPSWKKPIYKIISKLDSDIPEIFKSSSYP 540 550 560 570 580 590 pF1KB3 QELLHE CCDS73 Q >>CCDS45136.2 PROX2 gene_id:283571|Hs108|chr14 (365 aa) initn: 840 init1: 604 opt: 607 Z-score: 436.4 bits: 90.4 E(32554): 5.5e-18 Smith-Waterman score: 626; 44.0% identity (69.3% similar) in 257 aa overlap (492-727:109-360) 470 480 490 500 510 520 pF1KB3 QPLHQSPLSATTGFTTSTFRHPFPLPLMAYPFQSPLGAPSGSFS-GKDRASPESLDLTRD : . : :. ... :. ...:. .:. CCDS45 PNPLVPGNAQAGVSPRCPKKARERKRKQNLPTPQGLLMPAPAWDQGNRKGGPR----VRE 80 90 100 110 120 130 530 540 550 560 570 pF1KB3 TTSLRTKMSSHHLSHHPCSPAHPPSTAEGLS--------LSLIKSE-CGDLQDMSEISPY : :.. .::..: . :.: .::.: . :: ... :: . . . CCDS45 QLHL-LKQQLRHLQEHILQAAKPRDTAQGPGGCGTGKGPLSAKQGNGCGPRPWVVDGDHQ 140 150 160 170 180 190 580 590 600 610 620 pF1KB3 SGSAMQEGLSPNHLKKAKLMFFYTRYPSS-NMLKTYFSDV----------KFNRCITSQL .:.. . . . .: .. : :. . :.: ..:. .. . :::::::::. CCDS45 QGTSKDLSGAEKHQESEKPSFLPSGAPASLEILRKELTRAVSQAVDSVLQKFNRCITSQM 200 210 220 230 240 250 630 640 650 660 670 680 pF1KB3 IKWFSNFREFYYIQMEKYARQAINDGVTSTEELSITRDCELYRALNMHYNKANDFEVPER ::::::::::::::::: :::::.::::. . : . :. ::..::::::::.::::::. CCDS45 IKWFSNFREFYYIQMEKSARQAISDGVTNPKMLVVLRNSELFQALNMHYNKGNDFEVPDC 260 270 280 290 300 310 690 700 710 720 730 pF1KB3 FLEVAQITLREFFNAIIAGKDVDPSWKKAIYKVICKLDSEVPEIFKSPNCLQELLHE :::.:..::.::: :. ::.: :::::: :::.: ::::..:::::: CCDS45 FLEIASLTLQEFFRAVSAGRDSDPSWKKPIYKIISKLDSDIPEIFKSSSYPQ 320 330 340 350 360 737 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 20:56:37 2016 done: Thu Nov 3 20:56:38 2016 Total Scan time: 3.350 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]