FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB5866, 491 aa
1>>>pF1KB5866 491 - 491 aa - 491 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.3375+/-0.000783; mu= 14.4808+/- 0.048
mean_var=98.6388+/-19.491, 0's: 0 Z-trim(110.8): 36 B-trim: 0 in 0/51
Lambda= 0.129137
statistics sampled from 11835 (11871) to 11835 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.715), E-opt: 0.2 (0.365), width: 16
Scan time: 3.190
The best scores are: opt bits E(32554)
CCDS3786.1 FGB gene_id:2244|Hs108|chr4 ( 491) 3434 649.9 1.8e-186
CCDS47153.1 FGG gene_id:2266|Hs108|chr4 ( 437) 560 114.5 2.5e-25
CCDS3788.1 FGG gene_id:2266|Hs108|chr4 ( 453) 560 114.5 2.5e-25
CCDS6004.1 FGL1 gene_id:2267|Hs108|chr8 ( 312) 338 73.0 5.3e-13
CCDS6868.1 ANGPTL2 gene_id:23452|Hs108|chr9 ( 493) 302 66.4 8e-11
>>CCDS3786.1 FGB gene_id:2244|Hs108|chr4 (491 aa)
initn: 3434 init1: 3434 opt: 3434 Z-score: 3461.4 bits: 649.9 E(32554): 1.8e-186
Smith-Waterman score: 3434; 100.0% identity (100.0% similar) in 491 aa overlap (1-491:1-491)
10 20 30 40 50 60
pF1KB5 MKRMVSWSFHKLKTMKHLLLLLLCVFLVKSQGVNDNEEGFFSARGHRPLDKKREEAPSLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS37 MKRMVSWSFHKLKTMKHLLLLLLCVFLVKSQGVNDNEEGFFSARGHRPLDKKREEAPSLR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 PAPPPISGGGYRARPAKAAATQKKVERKAPDAGGCLHADPDLGVLCPTGCQLQEALLQQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS37 PAPPPISGGGYRARPAKAAATQKKVERKAPDAGGCLHADPDLGVLCPTGCQLQEALLQQE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 RPIRNSVDELNNNVEAVSQTSSSSFQYMYLLKDLWQKRQKQVKDNENVVNEYSSELEKHQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS37 RPIRNSVDELNNNVEAVSQTSSSSFQYMYLLKDLWQKRQKQVKDNENVVNEYSSELEKHQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB5 LYIDETVNSNIPTNLRVLRSILENLRSKIQKLESDVSAQMEYCRTPCTVSCNIPVVSGKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS37 LYIDETVNSNIPTNLRVLRSILENLRSKIQKLESDVSAQMEYCRTPCTVSCNIPVVSGKE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB5 CEEIIRKGGETSEMYLIQPDSSVKPYRVYCDMNTENGGWTVIQNRQDGSVDFGRKWDPYK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS37 CEEIIRKGGETSEMYLIQPDSSVKPYRVYCDMNTENGGWTVIQNRQDGSVDFGRKWDPYK
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB5 QGFGNVATNTDGKNYCGLPGEYWLGNDKISQLTRMGPTELLIEMEDWKGDKVKAHYGGFT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS37 QGFGNVATNTDGKNYCGLPGEYWLGNDKISQLTRMGPTELLIEMEDWKGDKVKAHYGGFT
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB5 VQNEANKYQISVNKYRGTAGNALMDGASQLMGENRTMTIHNGMFFSTYDRDNDGWLTSDP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS37 VQNEANKYQISVNKYRGTAGNALMDGASQLMGENRTMTIHNGMFFSTYDRDNDGWLTSDP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB5 RKQCSKEDGGGWWYNRCHAANPNGRYYWGGQYTWDMAKHGTDDGVVWMNWKGSWYSMRKM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS37 RKQCSKEDGGGWWYNRCHAANPNGRYYWGGQYTWDMAKHGTDDGVVWMNWKGSWYSMRKM
430 440 450 460 470 480
490
pF1KB5 SMKIRPFFPQQ
:::::::::::
CCDS37 SMKIRPFFPQQ
490
>>CCDS47153.1 FGG gene_id:2266|Hs108|chr4 (437 aa)
initn: 806 init1: 295 opt: 560 Z-score: 568.3 bits: 114.5 E(32554): 2.5e-25
Smith-Waterman score: 827; 33.2% identity (64.2% similar) in 400 aa overlap (95-487:34-415)
70 80 90 100 110 120
pF1KB5 PISGGGYRARPAKAAATQKKVERKAPDAGGCLHADPDLGVLCPTGCQLQEALLQQERPIR
: : .: ::: : . . : . .
CCDS47 SLHPRNLILYFYALLFLSSTCVAYVATRDNCCILDERFGSYCPTTCGIADFLSTYQTKVD
10 20 30 40 50 60
130 140 150 160 170 180
pF1KB5 NSVDELNNNVEAVSQTSSSSFQYMYLLKDLWQKRQKQVKDNENVVNEYSSELEKHQLYID
.... :.. .. : . .: : . .. .. ... . .... : .. .. . .
CCDS47 KDLQSLEDILHQVENKTSEVKQLIKAIQLTYNPDESSKPNMIDAATLKSRKMLEEIMKYE
70 80 90 100 110 120
190 200 210 220 230 240
pF1KB5 ETVNSNIPTNLRVLRSILENLRSKIQKLESDVSAQME-YCRTPCTVSCNIPVVSGKECEE
.. .. ...: :. : .. .:: .:. : ::.: :. :: . .: ..::.:..
CCDS47 ASILTH-DSSIRYLQEIYNSNNQKIVNLKEKV-AQLEAQCQEPCKDTVQIHDITGKDCQD
130 140 150 160 170 180
250 260 270 280 290 300
pF1KB5 IIRKGGETSEMYLIQPDSSVKPYRVYCDMNTENGGWTVIQNRQDGSVDFGRKWDPYKQGF
: ::.. : .:.:.: .. . . :::... ..::::.:.: :::::: ..: ::.::
CCDS47 IANKGAKQSGLYFIKPLKANQQFLVYCEIDGSGNGWTVFQKRLDGSVDFKKNWIQYKEGF
190 200 210 220 230 240
310 320 330 340 350 360
pF1KB5 GNVATNTDGKNYCGLPGEYWLGNDKISQLTRMG--PTELLIEMEDWKGDKVKAHYGGFTV
:... . : . :.::::.:: .. .. : : .:.:::.: : :. : :
CCDS47 GHLSPT--GTT------EFWLGNEKIHLISTQSAIPYALRVELEDWNGRTSTADYAMFKV
250 260 270 280 290
370 380 390 400 410
pF1KB5 QNEANKYQISVNKYRG-TAGNALMDGASQLMGEN---RTMTIHNGMFFSTYDRDNDGWLT
::.::... . : ::.:. :: . .:.. . .: :::: :::.: ::: .
CCDS47 GPEADKYRLTYAYFAGGDAGDAF-DGFD--FGDDPSDKFFTSHNGMQFSTWDNDNDKF--
300 310 320 330 340
420 430 440 450 460 470
pF1KB5 SDPRKQCSKEDGGGWWYNRCHAANPNGRYYWGGQYTWDMAKHGTDDGVVWMNWKGSWYSM
. .:...::.:::.:.:::.. :: :: :: :. . .: :.:..: .:: ::::
CCDS47 ---EGNCAEQDGSGWWMNKCHAGHLNGVYYQGGTYSKASTPNGYDNGIIWATWKTRWYSM
350 360 370 380 390 400
480 490
pF1KB5 RKMSMKIRPFFPQQ
.: .::: ::
CCDS47 KKTTMKIIPFNRLTIGEGQQHHLGGAKQAGDV
410 420 430
>>CCDS3788.1 FGG gene_id:2266|Hs108|chr4 (453 aa)
initn: 779 init1: 295 opt: 560 Z-score: 568.1 bits: 114.5 E(32554): 2.5e-25
Smith-Waterman score: 827; 33.2% identity (64.2% similar) in 400 aa overlap (95-487:34-415)
70 80 90 100 110 120
pF1KB5 PISGGGYRARPAKAAATQKKVERKAPDAGGCLHADPDLGVLCPTGCQLQEALLQQERPIR
: : .: ::: : . . : . .
CCDS37 SLHPRNLILYFYALLFLSSTCVAYVATRDNCCILDERFGSYCPTTCGIADFLSTYQTKVD
10 20 30 40 50 60
130 140 150 160 170 180
pF1KB5 NSVDELNNNVEAVSQTSSSSFQYMYLLKDLWQKRQKQVKDNENVVNEYSSELEKHQLYID
.... :.. .. : . .: : . .. .. ... . .... : .. .. . .
CCDS37 KDLQSLEDILHQVENKTSEVKQLIKAIQLTYNPDESSKPNMIDAATLKSRKMLEEIMKYE
70 80 90 100 110 120
190 200 210 220 230 240
pF1KB5 ETVNSNIPTNLRVLRSILENLRSKIQKLESDVSAQME-YCRTPCTVSCNIPVVSGKECEE
.. .. ...: :. : .. .:: .:. : ::.: :. :: . .: ..::.:..
CCDS37 ASILTH-DSSIRYLQEIYNSNNQKIVNLKEKV-AQLEAQCQEPCKDTVQIHDITGKDCQD
130 140 150 160 170 180
250 260 270 280 290 300
pF1KB5 IIRKGGETSEMYLIQPDSSVKPYRVYCDMNTENGGWTVIQNRQDGSVDFGRKWDPYKQGF
: ::.. : .:.:.: .. . . :::... ..::::.:.: :::::: ..: ::.::
CCDS37 IANKGAKQSGLYFIKPLKANQQFLVYCEIDGSGNGWTVFQKRLDGSVDFKKNWIQYKEGF
190 200 210 220 230 240
310 320 330 340 350 360
pF1KB5 GNVATNTDGKNYCGLPGEYWLGNDKISQLTRMG--PTELLIEMEDWKGDKVKAHYGGFTV
:... . : . :.::::.:: .. .. : : .:.:::.: : :. : :
CCDS37 GHLSPT--GTT------EFWLGNEKIHLISTQSAIPYALRVELEDWNGRTSTADYAMFKV
250 260 270 280 290
370 380 390 400 410
pF1KB5 QNEANKYQISVNKYRG-TAGNALMDGASQLMGEN---RTMTIHNGMFFSTYDRDNDGWLT
::.::... . : ::.:. :: . .:.. . .: :::: :::.: ::: .
CCDS37 GPEADKYRLTYAYFAGGDAGDAF-DGFD--FGDDPSDKFFTSHNGMQFSTWDNDNDKF--
300 310 320 330 340
420 430 440 450 460 470
pF1KB5 SDPRKQCSKEDGGGWWYNRCHAANPNGRYYWGGQYTWDMAKHGTDDGVVWMNWKGSWYSM
. .:...::.:::.:.:::.. :: :: :: :. . .: :.:..: .:: ::::
CCDS37 ---EGNCAEQDGSGWWMNKCHAGHLNGVYYQGGTYSKASTPNGYDNGIIWATWKTRWYSM
350 360 370 380 390 400
480 490
pF1KB5 RKMSMKIRPFFPQQ
.: .::: ::
CCDS37 KKTTMKIIPFNRLTIGEGQQHHLGGAKQVRPEHPAETEYDSLYPEDDL
410 420 430 440 450
>>CCDS6004.1 FGL1 gene_id:2267|Hs108|chr8 (312 aa)
initn: 575 init1: 162 opt: 338 Z-score: 347.0 bits: 73.0 E(32554): 5.3e-13
Smith-Waterman score: 657; 39.0% identity (65.7% similar) in 300 aa overlap (195-489:37-309)
170 180 190 200 210 220
pF1KB5 NENVVNEYSSELEKHQLYIDETVNSNIPTNLRVLRSILENLRSKIQKLESDVSAQMEYCR
.:.:.. ... . ::..: .. .:.
CCDS60 FILVTTALTMGREISALEDCAQEQMRLRAQVRLLETRVKQQQVKIKQLLQENEVQFLDKG
10 20 30 40 50 60
230 240 250 260 270 280
pF1KB5 TPCTVSCNIPVVSGKE---CEEIIRKGGETSEMYLIQPDSSVKPYRVYCDMNTENGGWTV
:: : . : .. : ::. : . : .: :.: .: . ::::: ...:::::
CCDS60 DENTV---IDLGSKRQYADCSEIFNDGYKLSGFYKIKPLQSPAEFSVYCDM-SDGGGWTV
70 80 90 100 110 120
290 300 310 320 330 340
pF1KB5 IQNRQDGSVDFGRKWDPYKQGFGNVATNTDGKNYCGLPGEYWLGNDKISQLTRMGPTELL
:: :.::: .:.: : :..::: :. ::::::: .. :: . :
CCDS60 IQRRSDGSENFNRGWKDYENGFG---------NFVQKHGEYWLGNKNLHFLTTQEDYTLK
130 140 150 160 170
350 360 370 380 390 400
pF1KB5 IEMEDWKGDKVKAHYGGFTVQNEANKYQISVNKYRGTAGNALMDGASQLMGENRTMTIHN
:.. :.. .. :.: .: : .: : :......: ::::..: :... : . . :.
CCDS60 IDLADFEKNSRYAQYKNFKVGDEKNFYELNIGEYSGTAGDSL---AGNFHPEVQWWASHQ
180 190 200 210 220 230
410 420 430 440 450 460
pF1KB5 GMFFSTYDRDNDGWLTSDPRKQCSKEDGGGWWYNRCHAANPNGRYYWGGQYTWDMAKHGT
: :::.:::.:.. . .:..:: .:::.::::.:: :: :: .: :: :: :
CCDS60 RMKFSTWDRDHDNY-----EGNCAEEDQSGWWFNRCHSANLNGVYY-SGPYT---AK--T
240 250 260 270
470 480 490
pF1KB5 DDGVVWMNWKGSWYSMRKMSMKIRP--FFPQQ
:.:.::..:.: :::.... ::::: :.:
CCDS60 DNGIVWYTWHGWWYSLKSVVMKIRPNDFIPNVI
280 290 300 310
>>CCDS6868.1 ANGPTL2 gene_id:23452|Hs108|chr9 (493 aa)
initn: 541 init1: 235 opt: 302 Z-score: 307.8 bits: 66.4 E(32554): 8e-11
Smith-Waterman score: 640; 32.0% identity (57.8% similar) in 391 aa overlap (111-486:136-487)
90 100 110 120 130 140
pF1KB5 TQKKVERKAPDAGGCLHADPDLGVLCPTGCQLQEALLQQERPIRNSVDELNNNVEAVSQT
:: ::.. :... ::.. . . .
CCDS68 LQQLVEVDGGIVSEVKLLRKESRNMNSRVTQLYMQLLHEIIRKRDNALELSQLENRILNQ
110 120 130 140 150 160
150 160 170 180
pF1KB5 SSSSFQYMYLLKDLWQKRQKQVKDNENVVNEYSSELEKHQLYIDETVNS-----------
... .: ::: .: :. . .: .: ..::.: . .
CCDS68 TADMLQLASKYKDLEHKYQHLATLAHNQ-SEIIAQLEEHCQRVPSARPVPQPPPAAPPRV
170 180 190 200 210 220
190 200 210 220 230 240
pF1KB5 -NIPTNLRVLRSILEN-LRS--KIQKLESDVSAQMEYCRTPCTVSCNIPVVSGKECEEII
. :: :.. .: : ..: ... : . .. : : . : ..: . .
CCDS68 YQPPTYNRIINQISTNEIQSDQNLKVLPPPLPTMPTLTSLPS--STDKPSGPWRDCLQAL
230 240 250 260 270 280
250 260 270 280 290 300
pF1KB5 RKGGETSEMYLIQPDSSVKPYRVYCDMNTENGGWTVIQNRQDGSVDFGRKWDPYKQGFGN
. : .:: .::..:... . ..:.::. . ::::::: : ::::.: :.:. :::::::
CCDS68 EDGHDTSSIYLVKPENTNRLMQVWCDQRHDPGGWTVIQRRLDGSVNFFRNWETYKQGFGN
290 300 310 320 330 340
310 320 330 340 350 360
pF1KB5 VATNTDGKNYCGLPGEYWLGNDKISQLTRMGPTELLIEMEDWKGDKVKAHYGGFTVQNEA
. :::::: ..: :: .: .::. ::::.: :: :.:..: .. :.
CCDS68 I------------DGEYWLGLENIYWLTNQGNYKLLVTMEDWSGRKVFAEYASFRLEPES
350 360 370 380 390
370 380 390 400 410 420
pF1KB5 NKYQISVNKYRGTAGNALMDGASQLMGENRTMTIHNGMFFSTYDRDNDGWLTSDPRKQCS
. :.. ...:.:.::... : ::: :.: :::.: . . :.
CCDS68 EYYKLRLGRYHGNAGDSF--------------TWHNGKQFTTLDRDHDVYTGN-----CA
400 410 420 430
430 440 450 460 470 480
pF1KB5 KEDGGGWWYNRCHAANPNGRYYWGGQYTWDMAKHGTDDGVVWMNWKGSWYSMRKMSMKIR
. . :::::: : .: :: .: ::.: . .::: : ...:. ::..:. : ::
CCDS68 HYQKGGWWYNACAHSNLNGVWYRGGHY-----RSRYQDGVYWAEFRGGSYSLKKVVMMIR
440 450 460 470 480
490
pF1KB5 PFFPQQ
:
CCDS68 PNPNTFH
490
491 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 16:33:03 2016 done: Sat Nov 5 16:33:04 2016
Total Scan time: 3.190 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]