FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA0198, 496 aa
1>>>pF1KSDA0198 496 - 496 aa - 496 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.4356+/-0.000995; mu= 0.0134+/- 0.058
mean_var=321.7852+/-72.098, 0's: 0 Z-trim(114.4): 719 B-trim: 830 in 1/51
Lambda= 0.071498
statistics sampled from 14053 (14954) to 14053 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.785), E-opt: 0.2 (0.459), width: 16
Scan time: 3.740
The best scores are: opt bits E(32554)
CCDS13197.1 PLAGL2 gene_id:5326|Hs108|chr20 ( 496) 3453 370.0 3.3e-102
CCDS6165.1 PLAG1 gene_id:5324|Hs108|chr8 ( 500) 1452 163.6 4.6e-40
CCDS47860.1 PLAG1 gene_id:5324|Hs108|chr8 ( 418) 1278 145.6 1e-34
CCDS5202.1 PLAGL1 gene_id:5325|Hs108|chr6 ( 463) 1260 143.8 4e-34
CCDS5203.1 PLAGL1 gene_id:5325|Hs108|chr6 ( 411) 1096 126.8 4.5e-29
>>CCDS13197.1 PLAGL2 gene_id:5326|Hs108|chr20 (496 aa)
initn: 3453 init1: 3453 opt: 3453 Z-score: 1948.3 bits: 370.0 E(32554): 3.3e-102
Smith-Waterman score: 3453; 100.0% identity (100.0% similar) in 496 aa overlap (1-496:1-496)
10 20 30 40 50 60
pF1KSD MTTFFTSVPPWIQDAKQEEEVGWKLVPRPRGREAESQVKCQCEISGTPFSNGEKLRPHSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MTTFFTSVPPWIQDAKQEEEVGWKLVPRPRGREAESQVKCQCEISGTPFSNGEKLRPHSL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD PQPEQRPYSCPQLHCGKAFASKYKLYRHMATHSAQKPHQCMYCDKMFHRKDHLRNHLQTH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 PQPEQRPYSCPQLHCGKAFASKYKLYRHMATHSAQKPHQCMYCDKMFHRKDHLRNHLQTH
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD DPNKEALHCSECGKNYNTKLGYRRHLAMHAASSGDLSCKVCLQTFESTQALLEHLKAHSR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 DPNKEALHCSECGKNYNTKLGYRRHLAMHAASSGDLSCKVCLQTFESTQALLEHLKAHSR
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD RVAGGAKEKKHPCDHCDRRFYTRKDVRRHLVVHTGRKDFLCQYCAQRFGRKDHLTRHVKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 RVAGGAKEKKHPCDHCDRRFYTRKDVRRHLVVHTGRKDFLCQYCAQRFGRKDHLTRHVKK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD SHSQELLKIKTEPVDMLGLLSCSSTVSVKEELSPVLCMASRDVMGTKAFPGMLPMGMYGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SHSQELLKIKTEPVDMLGLLSCSSTVSVKEELSPVLCMASRDVMGTKAFPGMLPMGMYGA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD HIPTMPSTGVPHSLVHNTLPMGMSYPLESSPISSPAQLPPKYQLGSTSYLPDKLPKVEVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 HIPTMPSTGVPHSLVHNTLPMGMSYPLESSPISSPAQLPPKYQLGSTSYLPDKLPKVEVD
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD SFLAELPGSLSLSSAEPQPASPQPAAAAALLDEALLAKSPANLSEALCAANVDFSHLLGF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SFLAELPGSLSLSSAEPQPASPQPAAAAALLDEALLAKSPANLSEALCAANVDFSHLLGF
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD LPLNLPPCNPPGATGGLVMGYSQAEAQPLLTTLQAQPQDSPGAGGPLNFGPLHSLPPVFT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LPLNLPPCNPPGATGGLVMGYSQAEAQPLLTTLQAQPQDSPGAGGPLNFGPLHSLPPVFT
430 440 450 460 470 480
490
pF1KSD SGLSSTTLPRFHQAFQ
::::::::::::::::
CCDS13 SGLSSTTLPRFHQAFQ
490
>>CCDS6165.1 PLAG1 gene_id:5324|Hs108|chr8 (500 aa)
initn: 1642 init1: 1232 opt: 1452 Z-score: 832.8 bits: 163.6 E(32554): 4.6e-40
Smith-Waterman score: 1709; 52.0% identity (75.2% similar) in 504 aa overlap (6-496:3-500)
10 20 30 40 50 60
pF1KSD MTTFFTSVPPWIQDAKQEEEVGWKLVPRPRGREAESQVKCQCEISGTPFSNGEKLRPHSL
: .: ...... ..: : :: :.. . . :.. :.. :::. ::
CCDS61 MATVIPGDLSEVRDTQKV--PSGKRKRG-ETKPRKNFPCQLCDKAFNSVEKLKVHSY
10 20 30 40 50
70 80 90 100 110 120
pF1KSD PQPEQRPYSCPQLHCGKAFASKYKLYRHMATHSAQKPHQCMYCDKMFHRKDHLRNHLQTH
. .:::.: : : :::.::::: ::::::: .: :.: ::.:::::::::.:::.::
CCDS61 SHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRKDHLKNHLHTH
60 70 80 90 100 110
130 140 150 160 170 180
pF1KSD DPNKEALHCSECGKNYNTKLGYRRHLAMHAASSGDLSCKVCLQTFESTQALLEHLKAHSR
:::::...: :::::::::::..::::.:::.::::.::::::::::: .::::::.:.
CCDS61 DPNKETFKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSHAG
120 130 140 150 160 170
190 200 210 220 230 240
pF1KSD RVAGGAKEKKHPCDHCDRRFYTRKDVRRHLVVHTGRKDFLCQYCAQRFGRKDHLTRHVKK
. .::.::::: :.:::::::::::::::.:::::::::::::::::::::::::::.::
CCDS61 KSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHMKK
180 190 200 210 220 230
250 260 270 280 290 300
pF1KSD SHSQELLKIKTEPVDMLGLLSCSSTVSVKEELSPVLCMASRDVMGTKAFPGMLPMGMYGA
::.:::::.::::::.: ..:. .: .:.:: ::. . : ... .: : . : ...:..
CCDS61 SHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSELL-SKPFTNTLQLNLYNT
240 250 260 270 280 290
310 320 330 340 350
pF1KSD HIPTMPSTGVPHSLVHNTLPMGMSYPLESSPISSPAQLPPKYQLGSTSY---LPDK-LP-
. .: :.: :... .:::.::. :.. . . .: :: ..:::: .:.: :
CCDS61 PFQSMQSSGSAHQMI-TTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQPL
300 310 320 330 340 350
360 370 380 390 400
pF1KSD KVEVDSFLAELPGSLSLSSAEPQPAS-------PQPAAAAALLDEALLAKSPANLSEALC
: :..:.: :: :.. :: . : .: :: .. . :.:: ..:. :
CCDS61 KGEIESYLMELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDPLN
360 370 380 390 400 410
410 420 430 440 450 460
pF1KSD AANVDFSHLLGFLPLNLPPCNPPGATGGLVMGYSQAEAQPLLTTLQAQPQDSPGAGGPLN
. .:::.:..:.::: :: :: ..:.: :.::: ::. .. : : :: .. ..
CCDS61 TPALDFSQLFNFIPLNGPPYNPL-SVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANTIG
420 430 440 450 460 470
470 480 490
pF1KSD FGPLHSLPPVFTSGLS-STTLPRFHQAFQ
.: :::: .:::.:: ::::::::::::
CCDS61 LGSLHSLSAAFTSSLSTSTTLPRFHQAFQ
480 490 500
>>CCDS47860.1 PLAG1 gene_id:5324|Hs108|chr8 (418 aa)
initn: 1557 init1: 1088 opt: 1278 Z-score: 736.8 bits: 145.6 E(32554): 1e-34
Smith-Waterman score: 1535; 55.1% identity (77.7% similar) in 421 aa overlap (89-496:1-418)
60 70 80 90 100 110
pF1KSD SLPQPEQRPYSCPQLHCGKAFASKYKLYRHMATHSAQKPHQCMYCDKMFHRKDHLRNHLQ
::::: .: :.: ::.:::::::::.:::.
CCDS47 MATHSPEKTHKCNYCEKMFHRKDHLKNHLH
10 20 30
120 130 140 150 160 170
pF1KSD THDPNKEALHCSECGKNYNTKLGYRRHLAMHAASSGDLSCKVCLQTFESTQALLEHLKAH
:::::::...: :::::::::::..::::.:::.::::.::::::::::: .::::::.:
CCDS47 THDPNKETFKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSH
40 50 60 70 80 90
180 190 200 210 220 230
pF1KSD SRRVAGGAKEKKHPCDHCDRRFYTRKDVRRHLVVHTGRKDFLCQYCAQRFGRKDHLTRHV
. . .::.::::: :.:::::::::::::::.:::::::::::::::::::::::::::.
CCDS47 AGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHM
100 110 120 130 140 150
240 250 260 270 280 290
pF1KSD KKSHSQELLKIKTEPVDMLGLLSCSSTVSVKEELSPVLCMASRDVMGTKAFPGMLPMGMY
::::.:::::.::::::.: ..:. .: .:.:: ::. . : ... .: : . : ...:
CCDS47 KKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSELL-SKPFTNTLQLNLY
160 170 180 190 200
300 310 320 330 340 350
pF1KSD GAHIPTMPSTGVPHSLVHNTLPMGMSYPLESSPISSPAQLPPKYQLGSTSY---LPDK-L
.. . .: :.: :... .:::.::. :.. . . .: :: ..:::: .:.:
CCDS47 NTPFQSMQSSGSAHQMI-TTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQ
210 220 230 240 250 260
360 370 380 390 400
pF1KSD P-KVEVDSFLAELPGSLSLSSAEPQPAS-------PQPAAAAALLDEALLAKSPANLSEA
: : :..:.: :: :.. :: . : .: :: .. . :.:: ..:.
CCDS47 PLKGEIESYLMELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDP
270 280 290 300 310 320
410 420 430 440 450 460
pF1KSD LCAANVDFSHLLGFLPLNLPPCNPPGATGGLVMGYSQAEAQPLLTTLQAQPQDSPGAGGP
: . .:::.:..:.::: :: :: ..:.: :.::: ::. .. : : :: ..
CCDS47 LNTPALDFSQLFNFIPLNGPPYNPL-SVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANT
330 340 350 360 370 380
470 480 490
pF1KSD LNFGPLHSLPPVFTSGLS-STTLPRFHQAFQ
...: :::: .:::.:: ::::::::::::
CCDS47 IGLGSLHSLSAAFTSSLSTSTTLPRFHQAFQ
390 400 410
>>CCDS5202.1 PLAGL1 gene_id:5325|Hs108|chr6 (463 aa)
initn: 728 init1: 614 opt: 1260 Z-score: 726.2 bits: 143.8 E(32554): 4e-34
Smith-Waterman score: 1260; 46.2% identity (68.6% similar) in 468 aa overlap (42-496:6-463)
20 30 40 50 60 70
pF1KSD IQDAKQEEEVGWKLVPRPRGREAESQVKCQCEISGTPFSNGEKLRPHSLPQPEQRPYSCP
:.. : : . ::. :. . ..:::.:
CCDS52 MATFPCQLCGKTFLTLEKFTIHNYSHSRERPYKCV
10 20 30
80 90 100 110 120 130
pF1KSD QLHCGKAFASKYKLYRHMATHSAQKPHQCMYCDKMFHRKDHLRNHLQTHDPNKEALHCSE
: :::::.:.:::.::::::: :: ::: .:.: :.:::::.:::::::::: :. : :
CCDS52 QPDCGKAFVSRYKLMRHMATHSPQKSHQCAHCEKTFNRKDHLKNHLQTHDPNKMAFGCEE
40 50 60 70 80 90
140 150 160 170 180 190
pF1KSD CGKNYNTKLGYRRHLAMHAASSGDLSCKVCLQTFESTQALLEHLKAHSR-RVAGGAKEKK
:::.::: :::.::::.::::::::.: :: . ::..::.:::::.. . .:.::::
CCDS52 CGKKYNTMLGYKRHLALHAASSGDLTCGVCALELGSTEVLLDHLKAHAEEKPPSGTKEKK
100 110 120 130 140 150
200 210 220 230 240 250
pF1KSD HPCDHCDRRFYTRKDVRRHLVVHTGRKDFLCQYCAQRFGRKDHLTRHVKKSHSQELLKIK
: ::::.: :::::::::::::::: ::::::.::::::::::::::.::.:::::.: .
CCDS52 HQCDHCERCFYTRKDVRRHLVVHTGCKDFLCQFCAQRFGRKDHLTRHTKKTHSQELMKES
160 170 180 190 200 210
260 270 280 290 300
pF1KSD TEPVDMLGLL-SCSSTVSVKEELSPVLCMASRDVMG-TKAFPGML-PMGMYGAHIPTMPS
. :.:. . . : . ..: : . ... : ....:. . . . . ..:
CCDS52 LQTGDLLSTFHTISPSFQLKAAALPPFPLGASAQNGLASSLPAEVHSLTLSPPEQAAQPM
220 230 240 250 260 270
310 320 330 340 350 360
pF1KSD TGVPHSLVHNTLPMGMSYPLESSPISSPAQLPP-KYQLGSTSYLP-DKLP-KVEVDSFLA
.:.::. .: .: :: : : :: ::. :::: : .:: :... .:
CCDS52 QPLPESLA--SL-----HP-SVSPGSPPPPLPNHKYNTTSTSYSPLASLPLKADTKGFCN
280 290 300 310 320
370 380 390 400 410 420
pF1KSD -ELPGSLSLSSAE-PQPASPQPAAAAALLDEALLAKS-PANLSEALCAANVDFSHLLGFL
: .: :. . :: .: : . .. : : ::. . :..:.: ::::
CCDS52 ISLFEDLPLQEPQSPQKLNPGFDLAKGNAGKVNLPKELPADAVNLTIPASLDLSPLLGF-
330 340 350 360 370 380
430 440 450 460 470
pF1KSD PLNLPPCNPPGATGGLVMGYSQAEAQPL-LTTLQAQPQDSPGAGGPLNFG--PLHSLPPV
.::: .. :. ... . .:. : :. : : :. : : : ...: :: .: :
CCDS52 -WQLPPPATQNTFGNSTLALGPGESLPHRLSCLGQQQQEPPLAMGTVSLGQLPLPPIPHV
390 400 410 420 430 440
480 490
pF1KSD FTSGLSSTTLPRFHQAFQ
:..: .:. ::.::.::.
CCDS52 FSAGTGSAILPHFHHAFR
450 460
>>CCDS5203.1 PLAGL1 gene_id:5325|Hs108|chr6 (411 aa)
initn: 588 init1: 473 opt: 1096 Z-score: 635.4 bits: 126.8 E(32554): 4.5e-29
Smith-Waterman score: 1096; 46.1% identity (68.2% similar) in 421 aa overlap (89-496:1-411)
60 70 80 90 100 110
pF1KSD SLPQPEQRPYSCPQLHCGKAFASKYKLYRHMATHSAQKPHQCMYCDKMFHRKDHLRNHLQ
::::: :: ::: .:.: :.:::::.::::
CCDS52 MATHSPQKSHQCAHCEKTFNRKDHLKNHLQ
10 20 30
120 130 140 150 160 170
pF1KSD THDPNKEALHCSECGKNYNTKLGYRRHLAMHAASSGDLSCKVCLQTFESTQALLEHLKAH
:::::: :. : ::::.::: :::.::::.::::::::.: :: . ::..::.:::::
CCDS52 THDPNKMAFGCEECGKKYNTMLGYKRHLALHAASSGDLTCGVCALELGSTEVLLDHLKAH
40 50 60 70 80 90
180 190 200 210 220 230
pF1KSD SR-RVAGGAKEKKHPCDHCDRRFYTRKDVRRHLVVHTGRKDFLCQYCAQRFGRKDHLTRH
.. . .:.::::: ::::.: :::::::::::::::: ::::::.::::::::::::::
CCDS52 AEEKPPSGTKEKKHQCDHCERCFYTRKDVRRHLVVHTGCKDFLCQFCAQRFGRKDHLTRH
100 110 120 130 140 150
240 250 260 270 280 290
pF1KSD VKKSHSQELLKIKTEPVDMLGLL-SCSSTVSVKEELSPVLCMASRDVMG-TKAFPGML-P
.::.:::::.: . . :.:. . . : . ..: : . ... : ....:. .
CCDS52 TKKTHSQELMKESLQTGDLLSTFHTISPSFQLKAAALPPFPLGASAQNGLASSLPAEVHS
160 170 180 190 200 210
300 310 320 330 340 350
pF1KSD MGMYGAHIPTMPSTGVPHSLVHNTLPMGMSYPLESSPISSPAQLPP-KYQLGSTSYLP-D
. . . ..: .:.::. .: .: :: : : :: ::. :::: :
CCDS52 LTLSPPEQAAQPMQPLPESLA--SL-----HP-SVSPGSPPPPLPNHKYNTTSTSYSPLA
220 230 240 250 260
360 370 380 390 400
pF1KSD KLP-KVEVDSFLA-ELPGSLSLSSAE-PQPASPQPAAAAALLDEALLAKS-PANLSEALC
.:: :... .: : .: :. . :: .: : . .. : : ::. .
CCDS52 SLPLKADTKGFCNISLFEDLPLQEPQSPQKLNPGFDLAKGNAGKVNLPKELPADAVNLTI
270 280 290 300 310 320
410 420 430 440 450 460
pF1KSD AANVDFSHLLGFLPLNLPPCNPPGATGGLVMGYSQAEAQPL-LTTLQAQPQDSPGAGGPL
:..:.: :::: .::: .. :. ... . .:. : :. : : :. : : : .
CCDS52 PASLDLSPLLGF--WQLPPPATQNTFGNSTLALGPGESLPHRLSCLGQQQQEPPLAMGTV
330 340 350 360 370 380
470 480 490
pF1KSD NFG--PLHSLPPVFTSGLSSTTLPRFHQAFQ
..: :: .: ::..: .:. ::.::.::.
CCDS52 SLGQLPLPPIPHVFSAGTGSAILPHFHHAFR
390 400 410
496 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 00:35:39 2016 done: Thu Nov 3 00:35:40 2016
Total Scan time: 3.740 Total Display time: 0.020
Function used was FASTA [36.3.4 Apr, 2011]