FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB3878, 382 aa
1>>>pF1KB3878 382 - 382 aa - 382 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.1060+/-0.000996; mu= -1.8232+/- 0.061
mean_var=360.8378+/-73.198, 0's: 0 Z-trim(116.1): 112 B-trim: 56 in 1/51
Lambda= 0.067518
statistics sampled from 16550 (16660) to 16550 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.804), E-opt: 0.2 (0.512), width: 16
Scan time: 2.210
The best scores are: opt bits E(32554)
CCDS1438.1 PRELP gene_id:5549|Hs108|chr1 ( 382) 2655 271.9 6.7e-73
CCDS9037.1 KERA gene_id:11081|Hs108|chr12 ( 352) 1247 134.7 1.2e-31
CCDS30976.1 FMOD gene_id:2331|Hs108|chr1 ( 376) 858 96.8 3.3e-20
CCDS6696.1 OMD gene_id:4958|Hs108|chr9 ( 421) 780 89.3 6.9e-18
CCDS9038.1 LUM gene_id:4060|Hs108|chr12 ( 338) 775 88.7 8.3e-18
>>CCDS1438.1 PRELP gene_id:5549|Hs108|chr1 (382 aa)
initn: 2655 init1: 2655 opt: 2655 Z-score: 1422.2 bits: 271.9 E(32554): 6.7e-73
Smith-Waterman score: 2655; 100.0% identity (100.0% similar) in 382 aa overlap (1-382:1-382)
10 20 30 40 50 60
pF1KB3 MRSPLCWLLPLLILASVAQGQPTRRPRPGTGPGRRPRPRPRPTPSFPQPDEPAEPTDLPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 MRSPLCWLLPLLILASVAQGQPTRRPRPGTGPGRRPRPRPRPTPSFPQPDEPAEPTDLPP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 PLPPGPPSIFPDCPRECYCPPDFPSALYCDSRNLRKVPVIPPRIHYLYLQNNFITELPVE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 PLPPGPPSIFPDCPRECYCPPDFPSALYCDSRNLRKVPVIPPRIHYLYLQNNFITELPVE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 SFQNATGLRWINLDNNRIRKIDQRVLEKLPGLVFLYMEKNQLEEVPSALPRNLEQLRLSQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 SFQNATGLRWINLDNNRIRKIDQRVLEKLPGLVFLYMEKNQLEEVPSALPRNLEQLRLSQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB3 NHISRIPPGVFSKLENLLLLDLQHNRLSDGVFKPDTFHGLKNLMQLNLAHNILRKMPPRV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 NHISRIPPGVFSKLENLLLLDLQHNRLSDGVFKPDTFHGLKNLMQLNLAHNILRKMPPRV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB3 PTAIHQLYLDSNKIETIPNGYFKSFPNLAFIRLNYNKLTDRGLPKNSFNISNLLVLHLSH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 PTAIHQLYLDSNKIETIPNGYFKSFPNLAFIRLNYNKLTDRGLPKNSFNISNLLVLHLSH
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB3 NRISSVPAINNRLEHLYLNNNSIEKINGTQICPNDLVAFHDFSSDLENVPHLRYLRLDGN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 NRISSVPAINNRLEHLYLNNNSIEKINGTQICPNDLVAFHDFSSDLENVPHLRYLRLDGN
310 320 330 340 350 360
370 380
pF1KB3 YLKPPIPLDLMMCFRLLQSVVI
::::::::::::::::::::::
CCDS14 YLKPPIPLDLMMCFRLLQSVVI
370 380
>>CCDS9037.1 KERA gene_id:11081|Hs108|chr12 (352 aa)
initn: 1419 init1: 740 opt: 1247 Z-score: 681.5 bits: 134.7 E(32554): 1.2e-31
Smith-Waterman score: 1247; 57.3% identity (84.8% similar) in 316 aa overlap (72-382:41-352)
50 60 70 80 90 100
pF1KB3 PTPSFPQPDEPAEPTDLPPPLPPGPPSIFPDCPRECYCPPDFPSALYCDSRNLRKVPVIP
.:: ::.:::.::.::::..:.:...:.::
CCDS90 VLFITDTVWSRSVRQVYEVHDSDDWTIHDFECPMECFCPPSFPTALYCENRGLKEIPAIP
20 30 40 50 60 70
110 120 130 140 150
pF1KB3 PRIHYLYLQNNFITELPVESFQNATGLRWINLDNNRIRK--IDQRVLEKLPGLVFLYMEK
:: :::::::.: .: . :.::: ::::::..:.: . :.. .: .: :.::..:
CCDS90 SRIWYLYLQNNLIETIPEKPFENATQLRWINLNKNKITNYGIEKGALSQLKKLLFLFLED
80 90 100 110 120 130
160 170 180 190 200 210
pF1KB3 NQLEEVPSALPRNLEQLRLSQNHISRIPPGVFSKLENLLLLDLQHNRLSDGVFKPDTFHG
:.:::::: :::.::::.:..:..:::: :.::.:::: :::::.:.: :..:. :::.:
CCDS90 NELEEVPSPLPRSLEQLQLARNKVSRIPQGTFSNLENLTLLDLQNNKLVDNAFQRDTFKG
140 150 160 170 180 190
220 230 240 250 260 270
pF1KB3 LKNLMQLNLAHNILRKMPPRVPTAIHQLYLDSNKIETIPNGYFKSFPNLAFIRLNYNKLT
::::::::.:.: ::.::::.:. ::.::.:.:: ::..::. .:..::.:::.:::.
CCDS90 LKNLMQLNMAKNALRNMPPRLPANTMQLFLDNNSIEGIPENYFNVIPKVAFLRLNHNKLS
200 210 220 230 240 250
280 290 300 310 320 330
pF1KB3 DRGLPKNSFNISNLLVLHLSHNRISSVPAINNRLEHLYLNNNSIEKINGTQICPND--LV
:.:::. .:..:..: :.::::....:: :. .:.::.:..:.:...: . :::. :
CCDS90 DEGLPSRGFDVSSILDLQLSHNQLTKVPRISAHLQHLHLDHNKIKSVNVSVICPSPSMLP
260 270 280 290 300 310
340 350 360 370 380
pF1KB3 AFHD-FSSDLENVPHLRYLRLDGNYLKPPIPLDLMMCFRLLQSVVI
: .: :: ::::::::::: .:::::. :: ::::::.:.:
CCDS90 AERDSFSYG----PHLRYLRLDGNEIKPPIPMALMTCFRLLQAVII
320 330 340 350
>>CCDS30976.1 FMOD gene_id:2331|Hs108|chr1 (376 aa)
initn: 966 init1: 360 opt: 858 Z-score: 476.3 bits: 96.8 E(32554): 3.3e-20
Smith-Waterman score: 905; 40.2% identity (68.6% similar) in 388 aa overlap (7-382:3-376)
10 20 30 40 50
pF1KB3 MRSPLCW--LLPLLILASVAQGQPTRRPRPGTGPGRRPRPRPRPTPSFPQPDEPAEP---
: :: : : :..:.: :. : . : : : : ::
CCDS30 MQWTSLLLLAGLFSLSQAQYEDDPHWWFHY-LRSQQSTYYDPYDPYPYETYEPYPY
10 20 30 40 50
60 70 80 90 100 110
pF1KB3 -TDLPPPLPPGPPSIFPD---CPRECYCPPDFPSALYCDSRNLRKVPVIPPRIHYLYLQN
.: : : :: :: ::.:: :::.::.:.:::.:::. .: .: :..:.:.::
CCDS30 GVDEGPAYTYGSPSP-PDPRDCPQECDCPPNFPTAMYCDNRNLKYLPFVPSRMKYVYFQN
60 70 80 90 100 110
120 130 140 150 160
pF1KB3 NFITELPVESFQNATGLRWINLDNNRIR--KIDQRVLEKLPGLVFLYMEKNQLEEVPSAL
: :: . :.::::: :: : .:.: :. ..:. :: : ::...:.: ..:. :
CCDS30 NQITSIQEGVFDNATGLLWIALHGNQITSDKVGRKVFSKLRHLERLYLDHNNLTRMPGPL
120 130 140 150 160 170
170 180 190 200 210 220
pF1KB3 PRNLEQLRLSQNHISRIPPGVFSKLENLLLLDLQHNRLSDGVFKPDTFHGLKNLMQLNLA
::.:..:.:..:.:::.: ... :::: : ::::.... ....::..:. :.:.
CCDS30 PRSLRELHLDHNQISRVPNNALEGLENLTALYLQHNEIQE---VGSSMRGLRSLILLDLS
180 190 200 210 220 230
230 240 250 260 270 280
pF1KB3 HNILRKMPPRVPTAIHQLYLDSNKIETIPNGYFKSFPNLAFIRLNYNKLTDRGLPKNSFN
.: :::.: .:.:..:::.. :.. :.:..::.. :.: ..::..:.::. :: .:.::
CCDS30 YNHLRKVPDGLPSALEQLYMEHNNVYTVPDSYFRGAPKLLYVRLSHNSLTNNGLASNTFN
240 250 260 270 280 290
290 300 310 320 330 340
pF1KB3 ISNLLVLHLSHNRISSVPAINNRLEHLYLNNNSIEKINGTQICPNDLVAFHDFSSDLENV
:.:: : ::.:.....: .:. ::.:::..: :.... ...: .: :. :
CCDS30 SSSLLELDLSYNQLQKIPPVNTNLENLYLQGNRINEFSISSFCT--VV-------DVVNF
300 310 320 330 340
350 360 370 380
pF1KB3 PHLRYLRLDGNYLK-PPIPLDLMMCFRLLQSVVI
.:. :::::: .: .: : .:.:: . . :
CCDS30 SKLQVLRLDGNEIKRSAMPADAPLCLRLASLIEI
350 360 370
>>CCDS6696.1 OMD gene_id:4958|Hs108|chr9 (421 aa)
initn: 877 init1: 391 opt: 780 Z-score: 434.7 bits: 89.3 E(32554): 6.9e-18
Smith-Waterman score: 835; 43.1% identity (71.4% similar) in 311 aa overlap (73-380:62-360)
50 60 70 80 90 100
pF1KB3 TPSFPQPDEPAEPTDLPPPLPPGPPSIFPDCPRECYCPPDFPSALYCDSRNLRKVPVIPP
: ::.:: .:::..:::.:.:. .: ::
CCDS66 DQEPDDDYQTGFPFRQNVDYGVPFHQYTLGCVSECFCPTNFPSSMYCDNRKLKTIPNIPM
40 50 60 70 80 90
110 120 130 140 150 160
pF1KB3 RIHYLYLQNNFITELPVESFQNATGLRWINLDNNRIR--KIDQRVLEKLPGLVFLYMEKN
.:. :::: : : . ..:: ::: :. :::..:.:. ::: :. :::.:. :..:.:
CCDS66 HIQQLYLQFNEIEAVTANSFINATHLKEINLSHNKIKSQKIDYGVFAKLPNLLQLHLEHN
100 110 120 130 140 150
170 180 190 200 210 220
pF1KB3 QLEEVPSALPRNLEQLRLSQNHISRIPPGVFSKLENLLLLDLQHNRLSDGVFKPDTFHGL
.::: : ::..::.: :. :.::.. .... : :: .::: .: : :...: : .
CCDS66 NLEEFPFPLPKSLERLLLGYNEISKLQTNAMDGLVNLTMLDLCYNYLHDSLLKDKIFAKM
160 170 180 190 200 210
230 240 250 260 270 280
pF1KB3 KNLMQLNLAHNILRKMPPRVPTAIHQLYLDSNKIETIPNGYFKSFPNLAFIRLNYNKLTD
..:::::: : :..::: .:... : :..:.: .::. :: ..:.: .:...::: :
CCDS66 EKLMQLNLCSNRLESMPPGLPSSLMYLSLENNSISSIPEKYFDKLPKLHTLRMSHNKLQD
220 230 240 250 260 270
290 300 310 320 330
pF1KB3 RGLPKNSFNISNLLVLHLSHNRISSVPAINNRLEHLYLNNNSIEKINGTQICPN-DLVAF
.: : ::. :.. : ..::..... : ::::::.:: :::.: : .::. : . .
CCDS66 --IPYNIFNLPNIVELSVGHNKLKQAFYIPRNLEHLYLQNNEIEKMNLTVMCPSIDPLHY
280 290 300 310 320
340 350 360 370 380
pF1KB3 HDFSSDLENVPHLRYLRLDGNYLKPPIPLDLMMCFRLLQSVVI
: :: :.:.: : :: :: ...:: ....
CCDS66 H----------HLTYIRVDQNKLKEPISSYIFFCFPHIHTIYYGEQRSTNGQTIQLKTQV
330 340 350 360 370
CCDS66 FRRFPDDDDESEDHDDPDNAHESPEQEGAEGHFDLHYYENQE
380 390 400 410 420
>>CCDS9038.1 LUM gene_id:4060|Hs108|chr12 (338 aa)
initn: 719 init1: 344 opt: 775 Z-score: 433.2 bits: 88.7 E(32554): 8.3e-18
Smith-Waterman score: 805; 39.8% identity (72.8% similar) in 324 aa overlap (66-382:26-337)
40 50 60 70 80 90
pF1KB3 PRPRPRPTPSFPQPDEPAEPTDLPPPLPPGPPSIF----PDCPRECYCPPDFPSALYCDS
: ::. :.: :: :: ..:::.:::
CCDS90 MSLSAFTLFLALIGGTSGQYYDYDFPLSIYGQSSPNCAPECNCPESYPSAMYCDE
10 20 30 40 50
100 110 120 130 140
pF1KB3 RNLRKVPVIPPRIHYLYLQNNFITELPVESFQNATGLRWINLDNNRIR--KIDQRVLEKL
.:..::..:: :.::::.:: : .. ..:.:.: :.:. ::.: .. :: ::. ::
CCDS90 LKLKSVPMVPPGIKYLYLRNNQIDHIDEKAFENVTDLQWLILDHNLLENSKIKGRVFSKL
60 70 80 90 100 110
150 160 170 180 190 200
pF1KB3 PGLVFLYMEKNQLEEVPSALPRNLEQLRLSQNHISRIPPGVFSKLENLLLLDLQHNRLSD
: :....:.: : . ::..::.:.:..:.:... : : : :: .. ::::::..
CCDS90 KQLKKLHINHNNLTESVGPLPKSLEDLQLTHNKITKL--GSFEGLVNLTFIHLQHNRLKE
120 130 140 150 160 170
210 220 230 240 250 260
pF1KB3 GVFKPDTFHGLKNLMQLNLAHNILRKMPPRVPTAIHQLYLDSNKIETIPNGYFKSFPNLA
. . .:.:::.: :.:. : . ..: .:... ::::.::: .::. ::: : :
CCDS90 DAVSA-AFKGLKSLEYLDLSFNQIARLPSGLPVSLLTLYLDNNKISNIPDEYFKRFNALQ
180 190 200 210 220 230
270 280 290 300 310 320
pF1KB3 FIRLNYNKLTDRGLPKNSFNISNLLVLHLSHNRISSVPAINNRLEHLYLNNNSIEKINGT
..::..:.:.: :.: ::::.:.:. : ::.:.....:..:. ::. ::. :..::..
CCDS90 YLRLSHNELADSGIPGNSFNVSSLVELDLSYNKLKNIPTVNENLENYYLEVNQLEKFDIK
240 250 260 270 280 290
330 340 350 360 370 380
pF1KB3 QICPNDLVAFHDFSSDLENVPHLRYLRLDGNYL-KPPIPLDLMMCFRLLQSVVI
..: ... ..:. ...:::::: . . .: :.. :.:. . :..
CCDS90 SFC--KILGPLSYSK-------IKHLRLDGNRISETSLPPDMYECLRVANEVTLN
300 310 320 330
382 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 02:42:04 2016 done: Fri Nov 4 02:42:04 2016
Total Scan time: 2.210 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]