FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB3347, 737 aa
1>>>pF1KB3347 737 - 737 aa - 737 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.4274+/-0.00106; mu= 1.5188+/- 0.064
mean_var=211.0187+/-42.402, 0's: 0 Z-trim(110.7): 19 B-trim: 58 in 1/52
Lambda= 0.088290
statistics sampled from 11804 (11810) to 11804 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.704), E-opt: 0.2 (0.363), width: 16
Scan time: 3.350
The best scores are: opt bits E(32554)
CCDS31021.1 PROX1 gene_id:5629|Hs108|chr1 ( 737) 4916 639.4 5.8e-183
CCDS73663.1 PROX2 gene_id:283571|Hs108|chr14 ( 592) 835 119.5 1.5e-26
CCDS45136.2 PROX2 gene_id:283571|Hs108|chr14 ( 365) 607 90.4 5.5e-18
>>CCDS31021.1 PROX1 gene_id:5629|Hs108|chr1 (737 aa)
initn: 4916 init1: 4916 opt: 4916 Z-score: 3398.2 bits: 639.4 E(32554): 5.8e-183
Smith-Waterman score: 4916; 100.0% identity (100.0% similar) in 737 aa overlap (1-737:1-737)
10 20 30 40 50 60
pF1KB3 MPDHDSTALLSRQTKRRRVDIGVKRTVGTASAFFAKARATFFSAMNPQGSEQDVEYSVVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 MPDHDSTALLSRQTKRRRVDIGVKRTVGTASAFFAKARATFFSAMNPQGSEQDVEYSVVQ
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 HADGEKSNVLRKLLKRANSYEDAMMPFPGATIISQLLKNNMNKNGGTEPSFQASGLSSTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 HADGEKSNVLRKLLKRANSYEDAMMPFPGATIISQLLKNNMNKNGGTEPSFQASGLSSTG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 SEVHQEDICSNSSRDSPPECLSPFGRPTMSQFDMDRLCDEHLRAKRARVENIIRGMSHSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 SEVHQEDICSNSSRDSPPECLSPFGRPTMSQFDMDRLCDEHLRAKRARVENIIRGMSHSP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB3 SVALRGNENEREMAPQSVSPRESYRENKRKQKLPQQQQQSFQQLVSARKEQKREERRQLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 SVALRGNENEREMAPQSVSPRESYRENKRKQKLPQQQQQSFQQLVSARKEQKREERRQLK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB3 QQLEDMQKQLRQLQEKFYQIYDSTDSENDEDGNLSEDSMRSEILDARAQDSVGRSDNEMC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 QQLEDMQKQLRQLQEKFYQIYDSTDSENDEDGNLSEDSMRSEILDARAQDSVGRSDNEMC
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB3 ELDPGQFIDRARALIREQEMAENKPKREGNNKERDHGPNSLQPEGKHLAETLKQELNTAM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 ELDPGQFIDRARALIREQEMAENKPKREGNNKERDHGPNSLQPEGKHLAETLKQELNTAM
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB3 SQVVDTVVKVFSAKPSRQVPQVFPPLQIPQARFAVNGENHNFHTANQRLQCFGDVIIPNP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 SQVVDTVVKVFSAKPSRQVPQVFPPLQIPQARFAVNGENHNFHTANQRLQCFGDVIIPNP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB3 LDTFGNVQMASSTDQTEALPLVVRKNSSDQSASGPAAGGHHQPLHQSPLSATTGFTTSTF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LDTFGNVQMASSTDQTEALPLVVRKNSSDQSASGPAAGGHHQPLHQSPLSATTGFTTSTF
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB3 RHPFPLPLMAYPFQSPLGAPSGSFSGKDRASPESLDLTRDTTSLRTKMSSHHLSHHPCSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 RHPFPLPLMAYPFQSPLGAPSGSFSGKDRASPESLDLTRDTTSLRTKMSSHHLSHHPCSP
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB3 AHPPSTAEGLSLSLIKSECGDLQDMSEISPYSGSAMQEGLSPNHLKKAKLMFFYTRYPSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 AHPPSTAEGLSLSLIKSECGDLQDMSEISPYSGSAMQEGLSPNHLKKAKLMFFYTRYPSS
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB3 NMLKTYFSDVKFNRCITSQLIKWFSNFREFYYIQMEKYARQAINDGVTSTEELSITRDCE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 NMLKTYFSDVKFNRCITSQLIKWFSNFREFYYIQMEKYARQAINDGVTSTEELSITRDCE
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB3 LYRALNMHYNKANDFEVPERFLEVAQITLREFFNAIIAGKDVDPSWKKAIYKVICKLDSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LYRALNMHYNKANDFEVPERFLEVAQITLREFFNAIIAGKDVDPSWKKAIYKVICKLDSE
670 680 690 700 710 720
730
pF1KB3 VPEIFKSPNCLQELLHE
:::::::::::::::::
CCDS31 VPEIFKSPNCLQELLHE
730
>>CCDS73663.1 PROX2 gene_id:283571|Hs108|chr14 (592 aa)
initn: 1077 init1: 798 opt: 835 Z-score: 590.2 bits: 119.5 E(32554): 1.5e-26
Smith-Waterman score: 1094; 37.7% identity (59.9% similar) in 626 aa overlap (124-727:17-587)
100 110 120 130 140
pF1KB3 SQLLKNNMNKNGGTEPSFQASGLSSTGSEVHQEDICSNSSRDSPPECL---SPFGR---P
: . :... :.: : : ::: :
CCDS73 MDPNSILLSPQPQICSHLAEACTEGERSSSPPELDRDSPFPWSQVP
10 20 30 40
150 160 170 180 190 200
pF1KB3 TMSQFDMDRLCDEHLRAKRARVENIIRGMSHSPSVALRGNENEREMAPQSVSPR--ESYR
. : : . . :::..:::::::.:.::: ::. . :: : .:::: .. :
CCDS73 SSSPTDPEWFGDEHIQAKRARVETIVRGMCLSPNPLVPGN------AQAGVSPRCPKKAR
50 60 70 80 90 100
210 220 230 240 250 260
pF1KB3 ENKRKQKLPQQQQQSFQQLVSARKEQKREERRQLKQQLEDMQKQLRQLQEKFYQIYDSTD
: ::::.:: : .. . . : . .:. ....::. ...:::.:::.. : :
CCDS73 ERKRKQNLPTPQ--GLLMPAPAWDQGNRKGGPRVREQLHLLKQQLRHLQEHILQAAKPRD
110 120 130 140 150
270 280 290 300 310 320
pF1KB3 SENDEDGNLSEDSMRSEILDARAQDSVGRSDNEMCELDPGQFIDRARALIREQEMAENKP
. . : . . :.:. .. : : : . . . ..
CCDS73 TAQGPGGCGTGKGP----LSAKQGNGCG----------P-------RPWVVDGDHQQGTS
160 170 180 190
330 340 350 360 370 380
pF1KB3 KR-EGNNKERDHGPNSLQPEGKHLA-ETLKQELNTAMSQVVDTVV-KVFSAKPSR--QVP
: : .:... :. : : . : :..::. :.::.::.:. ::. :.. :.
CCDS73 KDLSGAEKHQESEKPSFLPSGAPASLEILRKELTRAVSQAVDSVLQKVLLDPPGHLTQLG
200 210 220 230 240 250
390 400 410 420 430
pF1KB3 QVFPPLQIPQARFA----VNGENHN---FHTANQRLQCFGDVIIPNPLDTFGNVQMASST
. : :. ..: :.: .. . . .:.: . : :. ::...:.
CCDS73 RSFQG-QVAEGRSEPSPPVGGACKDPLALAALPRRVQLQAGV----PV---GNLSLAKRL
260 270 280 290 300
440 450 460 470 480 490
pF1KB3 DQTE--ALPLVVRKNSSDQSASGPAAGGHHQPLHQSPLSATTGFTTSTFRHPFPLPLMAY
:. . : .. : .: :. : .. : .: :: : .. . : .
CCDS73 DSPRYPIPPRMTPKPCQDPPANFPLTAPSHIQENQI-LSQLLGHRYNNGHWSSSPPQDSS
310 320 330 340 350 360
500 510 520 530 540 550
pF1KB3 PFQSPLGAPSGSFSGKDRASPESLDLTRDTTSLRTKMSSHHLSHHPCSPAHPPSTAEGLS
. : . : .. ..:. : :... : ..: :: : :.
CCDS73 SQRHPSSEP--ALRPWRTTKPQPLVLSQQQCPL--PFTSAHLESLPLLPS----------
370 380 390 400 410
560 570 580 590 600 610
pF1KB3 LSLIKSECGDLQDMSEISPYSGSAMQEGLSPNHLKKAKLMFFYTRYPSSNMLKTYFSDVK
.: : :. . : :.: .::::.:.::::::::::.:::::::.::.:: ::.
CCDS73 ---VKMEQRGLHAVMEALPFSLVHIQEGLNPGHLKKAKLMFFFTRYPSSNLLKVYFPDVQ
420 430 440 450 460 470
620 630 640 650 660 670
pF1KB3 FNRCITSQLIKWFSNFREFYYIQMEKYARQAINDGVTSTEELSITRDCELYRALNMHYNK
::::::::.::::::::::::::::: :::::.::::. . : . :. ::..::::::::
CCDS73 FNRCITSQMIKWFSNFREFYYIQMEKSARQAISDGVTNPKMLVVLRNSELFQALNMHYNK
480 490 500 510 520 530
680 690 700 710 720 730
pF1KB3 ANDFEVPERFLEVAQITLREFFNAIIAGKDVDPSWKKAIYKVICKLDSEVPEIFKSPNCL
.::::::. :::.:..::.::: :. ::.: :::::: :::.: ::::..::::::
CCDS73 GNDFEVPDCFLEIASLTLQEFFRAVSAGRDSDPSWKKPIYKIISKLDSDIPEIFKSSSYP
540 550 560 570 580 590
pF1KB3 QELLHE
CCDS73 Q
>>CCDS45136.2 PROX2 gene_id:283571|Hs108|chr14 (365 aa)
initn: 840 init1: 604 opt: 607 Z-score: 436.4 bits: 90.4 E(32554): 5.5e-18
Smith-Waterman score: 626; 44.0% identity (69.3% similar) in 257 aa overlap (492-727:109-360)
470 480 490 500 510 520
pF1KB3 QPLHQSPLSATTGFTTSTFRHPFPLPLMAYPFQSPLGAPSGSFS-GKDRASPESLDLTRD
: . : :. ... :. ...:. .:.
CCDS45 PNPLVPGNAQAGVSPRCPKKARERKRKQNLPTPQGLLMPAPAWDQGNRKGGPR----VRE
80 90 100 110 120 130
530 540 550 560 570
pF1KB3 TTSLRTKMSSHHLSHHPCSPAHPPSTAEGLS--------LSLIKSE-CGDLQDMSEISPY
: :.. .::..: . :.: .::.: . :: ... :: . . .
CCDS45 QLHL-LKQQLRHLQEHILQAAKPRDTAQGPGGCGTGKGPLSAKQGNGCGPRPWVVDGDHQ
140 150 160 170 180 190
580 590 600 610 620
pF1KB3 SGSAMQEGLSPNHLKKAKLMFFYTRYPSS-NMLKTYFSDV----------KFNRCITSQL
.:.. . . . .: .. : :. . :.: ..:. .. . :::::::::.
CCDS45 QGTSKDLSGAEKHQESEKPSFLPSGAPASLEILRKELTRAVSQAVDSVLQKFNRCITSQM
200 210 220 230 240 250
630 640 650 660 670 680
pF1KB3 IKWFSNFREFYYIQMEKYARQAINDGVTSTEELSITRDCELYRALNMHYNKANDFEVPER
::::::::::::::::: :::::.::::. . : . :. ::..::::::::.::::::.
CCDS45 IKWFSNFREFYYIQMEKSARQAISDGVTNPKMLVVLRNSELFQALNMHYNKGNDFEVPDC
260 270 280 290 300 310
690 700 710 720 730
pF1KB3 FLEVAQITLREFFNAIIAGKDVDPSWKKAIYKVICKLDSEVPEIFKSPNCLQELLHE
:::.:..::.::: :. ::.: :::::: :::.: ::::..::::::
CCDS45 FLEIASLTLQEFFRAVSAGRDSDPSWKKPIYKIISKLDSDIPEIFKSSSYPQ
320 330 340 350 360
737 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 20:56:37 2016 done: Thu Nov 3 20:56:38 2016
Total Scan time: 3.350 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]