FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2416, 639 aa
1>>>pF1KE2416 639 - 639 aa - 639 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.0029+/-0.000876; mu= 17.4624+/- 0.053
mean_var=94.4882+/-18.765, 0's: 0 Z-trim(109.4): 11 B-trim: 48 in 1/49
Lambda= 0.131943
statistics sampled from 10854 (10859) to 10854 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.688), E-opt: 0.2 (0.334), width: 16
Scan time: 3.930
The best scores are: opt bits E(32554)
CCDS4418.1 SLC34A1 gene_id:6569|Hs108|chr5 ( 639) 4193 808.5 0
CCDS54953.1 SLC34A1 gene_id:6569|Hs108|chr5 ( 340) 2020 394.7 1.1e-109
CCDS7038.1 SLC34A3 gene_id:142680|Hs108|chr9 ( 599) 1889 369.9 5.5e-102
CCDS54750.1 SLC34A2 gene_id:10568|Hs108|chr4 ( 689) 1257 249.6 1e-65
CCDS3435.1 SLC34A2 gene_id:10568|Hs108|chr4 ( 690) 1257 249.6 1e-65
>>CCDS4418.1 SLC34A1 gene_id:6569|Hs108|chr5 (639 aa)
initn: 4193 init1: 4193 opt: 4193 Z-score: 4314.3 bits: 808.5 E(32554): 0
Smith-Waterman score: 4193; 100.0% identity (100.0% similar) in 639 aa overlap (1-639:1-639)
10 20 30 40 50 60
pF1KE2 MLSYGERLGSPAVSPLPVRGGHVMRGTAFAYVPSPQVLHRIPGTSAYAFPSLGPVALAEH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MLSYGERLGSPAVSPLPVRGGHVMRGTAFAYVPSPQVLHRIPGTSAYAFPSLGPVALAEH
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 TCPCGEVLERHEPLPAKLALEEEQKPESRLVPKLRQAGAMLLKVPLMLTFLYLFVCSLDM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 TCPCGEVLERHEPLPAKLALEEEQKPESRLVPKLRQAGAMLLKVPLMLTFLYLFVCSLDM
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 LSSAFQLAGGKVAGDIFKDNAILSNPVAGLVVGILVTVLVQSSSTSTSIIVSMVSSGLLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LSSAFQLAGGKVAGDIFKDNAILSNPVAGLVVGILVTVLVQSSSTSTSIIVSMVSSGLLE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 VSSAIPIIMGSNIGTSVTNTIVALMQAGDRTDFRRAFAGATVHDCFNWLSVLVLLPLEAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 VSSAIPIIMGSNIGTSVTNTIVALMQAGDRTDFRRAFAGATVHDCFNWLSVLVLLPLEAA
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 TGYLHHITRLVVASFNIHGGRDAPDLLKIITEPFTKLIIQLDESVITSIATGDESLRNHS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 TGYLHHITRLVVASFNIHGGRDAPDLLKIITEPFTKLIIQLDESVITSIATGDESLRNHS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 LIQIWCHPDSLQAPTSMSRAEANSSQTLGNATMEKCNHIFVDTGLPDLAVGLILLAGSLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LIQIWCHPDSLQAPTSMSRAEANSSQTLGNATMEKCNHIFVDTGLPDLAVGLILLAGSLV
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 LLCTCLILLVKMLNSLLKGQVAKVIQKVINTDFPAPFTWVTGYFAMVVGASMTFVVQSSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LLCTCLILLVKMLNSLLKGQVAKVIQKVINTDFPAPFTWVTGYFAMVVGASMTFVVQSSS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 VFTSAITPLIGLGVISIERAYPLTLGSNIGTTTTAILAALASPREKLSSAFQIALCHFFF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 VFTSAITPLIGLGVISIERAYPLTLGSNIGTTTTAILAALASPREKLSSAFQIALCHFFF
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 NISGILLWYPVPCTRLPIRMAKALGKRTAKYRWFAVLYLLVCFLLLPSLVFGISMAGWQV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 NISGILLWYPVPCTRLPIRMAKALGKRTAKYRWFAVLYLLVCFLLLPSLVFGISMAGWQV
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 MVGVGTPFGALLAFVVLINVLQSRSPGHLPKWLQTWDFLPRWMHSLKPLDHLITRATLCC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MVGVGTPFGALLAFVVLINVLQSRSPGHLPKWLQTWDFLPRWMHSLKPLDHLITRATLCC
550 560 570 580 590 600
610 620 630
pF1KE2 ARPEPRSPPLPPRVFLEELPPATPSPRLALPAHHNATRL
:::::::::::::::::::::::::::::::::::::::
CCDS44 ARPEPRSPPLPPRVFLEELPPATPSPRLALPAHHNATRL
610 620 630
>>CCDS54953.1 SLC34A1 gene_id:6569|Hs108|chr5 (340 aa)
initn: 2016 init1: 2016 opt: 2020 Z-score: 2082.7 bits: 394.7 E(32554): 1.1e-109
Smith-Waterman score: 2020; 92.6% identity (96.5% similar) in 339 aa overlap (1-336:1-339)
10 20 30 40 50 60
pF1KE2 MLSYGERLGSPAVSPLPVRGGHVMRGTAFAYVPSPQVLHRIPGTSAYAFPSLGPVALAEH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 MLSYGERLGSPAVSPLPVRGGHVMRGTAFAYVPSPQVLHRIPGTSAYAFPSLGPVALAEH
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 TCPCGEVLERHEPLPAKLALEEEQKPESRLVPKLRQAGAMLLKVPLMLTFLYLFVCSLDM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 TCPCGEVLERHEPLPAKLALEEEQKPESRLVPKLRQAGAMLLKVPLMLTFLYLFVCSLDM
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 LSSAFQLAGGKVAGDIFKDNAILSNPVAGLVVGILVTVLVQSSSTSTSIIVSMVSSGLLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 LSSAFQLAGGKVAGDIFKDNAILSNPVAGLVVGILVTVLVQSSSTSTSIIVSMVSSGLLE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 VSSAIPIIMGSNIGTSVTNTIVALMQAGDRTDFRRAFAGATVHDCFNWLSVLVLLPLEAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 VSSAIPIIMGSNIGTSVTNTIVALMQAGDRTDFRRAFAGATVHDCFNWLSVLVLLPLEAA
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 TGYLHHITRLVVASFNIHGGRDAPDLLKIITEPFTKLIIQLDESVITSIATGDESLRNHS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 TGYLHHITRLVVASFNIHGGRDAPDLLKIITEPFTKLIIQLDESVITSIATGDESLRNHS
250 260 270 280 290 300
310 320 330 340 350
pF1KE2 LIQIWCHPDSLQAPTS---MSRAEANSSQTLGNATMEKCNHIFVDTGLPDLAVGLILLAG
:::::::::::: ... . ..:.. .... .:
CCDS54 LIQIWCHPDSLQQNLEGREITHFDLRKKQAMEDSSVPHCP
310 320 330 340
360 370 380 390 400 410
pF1KE2 SLVLLCTCLILLVKMLNSLLKGQVAKVIQKVINTDFPAPFTWVTGYFAMVVGASMTFVVQ
>>CCDS7038.1 SLC34A3 gene_id:142680|Hs108|chr9 (599 aa)
initn: 1861 init1: 1061 opt: 1889 Z-score: 1944.4 bits: 369.9 E(32554): 5.5e-102
Smith-Waterman score: 1896; 51.9% identity (77.2% similar) in 591 aa overlap (41-618:5-584)
20 30 40 50 60
pF1KE2 PAVSPLPVRGGHVMRGTAFAYVPSPQVLHRIPGTSAYAFPSLGPVALAEHT------CPC
.:: : :.: : :.:.:
CCDS70 MPSSLPG-SQVPHPTLDAVDLVEKTLRNEGTSSS
10 20 30
70 80 90 100 110 120
pF1KE2 GEVLERHEPLPAKLA-LEEEQKP--ESRLVPKLRQAGAMLLKVPLMLTFLYLFVCSLDML
. :::. . : : :.. ..: : :.. .::.... .::. .: ::.:.::::.:
CCDS70 APVLEEGDTDPWTLPQLKDTSQPWKELRVAGRLRRVAGSVLKACGLLGSLYFFICSLDVL
40 50 60 70 80 90
130 140 150 160 170 180
pF1KE2 SSAFQLAGGKVAGDIFKDNAILSNPVAGLVVGILVTVLVQSSSTSTSIIVSMVSSGLLEV
:::::: :.::::::::::..:::::::::.:.:::.::::::::.::.::::.. :: :
CCDS70 SSAFQLLGSKVAGDIFKDNVVLSNPVAGLVIGVLVTALVQSSSTSSSIVVSMVAAKLLTV
100 110 120 130 140 150
190 200 210 220 230 240
pF1KE2 SSAIPIIMGSNIGTSVTNTIVALMQAGDRTDFRRAFAGATVHDCFNWLSVLVLLPLEAAT
..::::: :.:::.:.:.:.. :.::: .:.:::.:..:: ::::.::::::::.::
CCDS70 RVSVPIIMGVNVGTSITSTLVSMAQSGDRDEFQRAFSGSAVHGIFNWLTVLVLLPLESAT
160 170 180 190 200 210
250 260 270 280 290 300
pF1KE2 GYLHHITRLVVASFNIHGGRDAPDLLKIITEPFTKLIIQLDESVITSIATGDESLRNHSL
. :.....:.... .. .:::.::..:.:.:.::.::: ..: : :::. . : ::
CCDS70 ALLERLSELALGAASLTPRAQAPDILKVLTKPLTHLIVQLDSDMIMSSATGNAT--NSSL
220 230 240 250 260 270
310 320 330 340 350
pF1KE2 IQIWCHPDSLQAPTSMSRAEANSSQTLGNATMEK----CNHIFVDTGLPDLAVGLILLAG
:. :: . : : : . : :.: : :.:. : : ::::: :::::
CCDS70 IKHWCGTTG-QPTQENSSCGAFGPCTEKNSTAPADRLPCRHLFAGTELTDLAVGCILLAG
280 290 300 310 320 330
360 370 380 390 400 410
pF1KE2 SLVLLCTCLILLVKMLNSLLKGQVAKVIQKVINTDFPAPFTWVTGYFAMVVGASMTFVVQ
::..:: ::.:.::.:::.:.:.::.:.. :::.::: :. :. ::.:...::..::..:
CCDS70 SLLVLCGCLVLIVKLLNSVLRGRVAQVVRTVINADFPFPLGWLGGYLAVLAGAGLTFALQ
340 350 360 370 380 390
420 430 440 450 460 470
pF1KE2 SSSVFTSAITPLIGLGVISIERAYPLTLGSNIGTTTTAILAALASPREKLSSAFQIALCH
::::::.:..::.:.::::..::::: :::::::::::.::::::: ... ::.:.:: :
CCDS70 SSSVFTAAVVPLMGVGVISLDRAYPLLLGSNIGTTTTALLAALASPADRMLSALQVALIH
400 410 420 430 440 450
480 490 500 510 520 530
pF1KE2 FFFNISGILLWYPVPCTRLPIRMAKALGKRTAKYRWFAVLYLLVCFLLLPSLVFGISMAG
::::..:::::: :: :::: .:. .: ::.::: : .:::. ::::: .::.:.::
CCDS70 FFFNLAGILLWYLVPALRLPIPLARHFGVVTARYRWVAGVYLLLGFLLLPLAAFGLSLAG
460 470 480 490 500 510
540 550 560 570 580 590
pF1KE2 WQVMVGVGTPFGALLAFVVLINVLQSRSPGHLPKWLQTWDFLPRWMHSLKPLDHLITRAT
. ...:: :. .:. .:.:..::: : :. :: :..: .:: :.:::.: :.:.::
CCDS70 GMELAAVGGPLVGLVLLVILVTVLQRRRPAWLPVRLRSWAWLPVWLHSLEPWDRLVTR--
520 530 540 550 560
600 610 620 630
pF1KE2 LCCARPEPRSPPLPPRVFLEELPPATPSPRLALPAHHNATRL
:: : . ::.. .:
CCDS70 -CC----PCNVCSPPKATTKEAYCYENPEILASQQL
570 580 590
>>CCDS54750.1 SLC34A2 gene_id:10568|Hs108|chr4 (689 aa)
initn: 2194 init1: 1250 opt: 1257 Z-score: 1293.4 bits: 249.6 E(32554): 1e-65
Smith-Waterman score: 2176; 64.8% identity (87.0% similar) in 514 aa overlap (103-599:99-612)
80 90 100 110 120 130
pF1KE2 PLPAKLALEEEQKPESRLVPKLRQAGAMLLKVPLMLTFLYLFVCSLDMLSSAFQLAGGKV
.. :.: :::.::::::.:::::::.:::.
CCDS54 WNLPTLQDSGIKWSERDTKGKILCFFQGIGRLILLLGFLYFFVCSLDILSSAFQLVGGKM
70 80 90 100 110 120
140 150 160 170 180 190
pF1KE2 AGDIFKDNAILSNPVAGLVVGILVTVLVQSSSTSTSIIVSMVSSGLLEVSSAIPIIMGSN
::..:....:.:::. :::.:.:::::::::::::::.::::::.:: : .:::::::.:
CCDS54 AGQFFSNSSIMSNPLLGLVIGVLVTVLVQSSSTSTSIVVSMVSSSLLTVRAAIPIIMGAN
130 140 150 160 170 180
200 210 220 230 240 250
pF1KE2 IGTSVTNTIVALMQAGDRTDFRRAFAGATVHDCFNWLSVLVLLPLEAATGYLHHITRLVV
::::.:::::::::.:::..:::::::::::: :::::::::::.:.:: ::. ::.:.:
CCDS54 IGTSITNTIVALMQVGDRSEFRRAFAGATVHDFFNWLSVLVLLPVEVATHYLEIITQLIV
190 200 210 220 230 240
260 270 280 290 300
pF1KE2 ASFNIHGGRDAPDLLKIITEPFTKLIIQLDESVITSIATGDESLRNHSLIQIWCH-----
::....:.:::::::.::.::::::.:::..::..:: .::. .:.::..:::.
CCDS54 ESFHFKNGEDAPDLLKVITKPFTKLIVQLDKKVISQIAMNDEKAKNKSLVKIWCKTFTNK
250 260 270 280 290 300
310 320 330 340 350
pF1KE2 -------PDSLQAPT-SMSRAEANSSQTLGNATME----KCNHIFVDTGLPDLAVGLILL
:.. . . :. ... .. :. :.:.. ::.::::. ::::::: :::
CCDS54 TQINVTVPSTANCTSPSLCWTDGIQNWTMKNVTYKENIAKCQHIFVNFHLPDLAVGTILL
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE2 AGSLVLLCTCLILLVKMLNSLLKGQVAKVIQKVINTDFPAPFTWVTGYFAMVVGASMTFV
::..:: :::..::.:.:.:::::: ::.:.:::::: ::.:.:::.:..:::.:::.
CCDS54 ILSLLVLCGCLIMIVKILGSVLKGQVATVIKKTINTDFPFPFAWLTGYLAILVGAGMTFI
370 380 390 400 410 420
420 430 440 450 460 470
pF1KE2 VQSSSVFTSAITPLIGLGVISIERAYPLTLGSNIGTTTTAILAALASPREKLSSAFQIAL
::::::::::.:::::.:::.::::::::::::::::::::::::::: . : :..::::
CCDS54 VQSSSVFTSALTPLIGIGVITIERAYPLTLGSNIGTTTTAILAALASPGNALRSSLQIAL
430 440 450 460 470 480
480 490 500 510 520 530
pF1KE2 CHFFFNISGILLWYPVPCTRLPIRMAKALGKRTAKYRWFAVLYLLVCFLLLPSLVFGISM
:::::::::::::::.: :::::::::.::. .::::::::.::.. :.:.: :::.:.
CCDS54 CHFFFNISGILLWYPIPFTRLPIRMAKGLGNISAKYRWFAVFYLIIFFFLIPLTVFGLSL
490 500 510 520 530 540
540 550 560 570 580 590
pF1KE2 AGWQVMVGVGTPFGALLAFVVLINVLQSRSPGHLPKWLQTWDFLPRWMHSLKPLDHLITR
:::.:.::::.: .. .:. . .:::: : ::: ::.:.::: ::.:::: : ....
CCDS54 AGWRVLVGVGVPVVFIIILVLCLRLLQSRCPRVLPKKLQNWNFLPLWMRSLKPWDAVVSK
550 560 570 580 590 600
600 610 620 630
pF1KE2 ATLCCARPEPRSPPLPPRVFLEELPPATPSPRLALPAHHNATRL
: :
CCDS54 FTGCFQMRCCCCCRVCCRACCLLCDCPKCCRCSKCCEDLEEAQEGQDVPVKAPETFDNIT
610 620 630 640 650 660
>>CCDS3435.1 SLC34A2 gene_id:10568|Hs108|chr4 (690 aa)
initn: 2194 init1: 1250 opt: 1257 Z-score: 1293.4 bits: 249.6 E(32554): 1e-65
Smith-Waterman score: 2176; 64.8% identity (87.0% similar) in 514 aa overlap (103-599:100-613)
80 90 100 110 120 130
pF1KE2 PLPAKLALEEEQKPESRLVPKLRQAGAMLLKVPLMLTFLYLFVCSLDMLSSAFQLAGGKV
.. :.: :::.::::::.:::::::.:::.
CCDS34 WNLPTLQDSGIKWSERDTKGKILCFFQGIGRLILLLGFLYFFVCSLDILSSAFQLVGGKM
70 80 90 100 110 120
140 150 160 170 180 190
pF1KE2 AGDIFKDNAILSNPVAGLVVGILVTVLVQSSSTSTSIIVSMVSSGLLEVSSAIPIIMGSN
::..:....:.:::. :::.:.:::::::::::::::.::::::.:: : .:::::::.:
CCDS34 AGQFFSNSSIMSNPLLGLVIGVLVTVLVQSSSTSTSIVVSMVSSSLLTVRAAIPIIMGAN
130 140 150 160 170 180
200 210 220 230 240 250
pF1KE2 IGTSVTNTIVALMQAGDRTDFRRAFAGATVHDCFNWLSVLVLLPLEAATGYLHHITRLVV
::::.:::::::::.:::..:::::::::::: :::::::::::.:.:: ::. ::.:.:
CCDS34 IGTSITNTIVALMQVGDRSEFRRAFAGATVHDFFNWLSVLVLLPVEVATHYLEIITQLIV
190 200 210 220 230 240
260 270 280 290 300
pF1KE2 ASFNIHGGRDAPDLLKIITEPFTKLIIQLDESVITSIATGDESLRNHSLIQIWCH-----
::....:.:::::::.::.::::::.:::..::..:: .::. .:.::..:::.
CCDS34 ESFHFKNGEDAPDLLKVITKPFTKLIVQLDKKVISQIAMNDEKAKNKSLVKIWCKTFTNK
250 260 270 280 290 300
310 320 330 340 350
pF1KE2 -------PDSLQAPT-SMSRAEANSSQTLGNATME----KCNHIFVDTGLPDLAVGLILL
:.. . . :. ... .. :. :.:.. ::.::::. ::::::: :::
CCDS34 TQINVTVPSTANCTSPSLCWTDGIQNWTMKNVTYKENIAKCQHIFVNFHLPDLAVGTILL
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE2 AGSLVLLCTCLILLVKMLNSLLKGQVAKVIQKVINTDFPAPFTWVTGYFAMVVGASMTFV
::..:: :::..::.:.:.:::::: ::.:.:::::: ::.:.:::.:..:::.:::.
CCDS34 ILSLLVLCGCLIMIVKILGSVLKGQVATVIKKTINTDFPFPFAWLTGYLAILVGAGMTFI
370 380 390 400 410 420
420 430 440 450 460 470
pF1KE2 VQSSSVFTSAITPLIGLGVISIERAYPLTLGSNIGTTTTAILAALASPREKLSSAFQIAL
::::::::::.:::::.:::.::::::::::::::::::::::::::: . : :..::::
CCDS34 VQSSSVFTSALTPLIGIGVITIERAYPLTLGSNIGTTTTAILAALASPGNALRSSLQIAL
430 440 450 460 470 480
480 490 500 510 520 530
pF1KE2 CHFFFNISGILLWYPVPCTRLPIRMAKALGKRTAKYRWFAVLYLLVCFLLLPSLVFGISM
:::::::::::::::.: :::::::::.::. .::::::::.::.. :.:.: :::.:.
CCDS34 CHFFFNISGILLWYPIPFTRLPIRMAKGLGNISAKYRWFAVFYLIIFFFLIPLTVFGLSL
490 500 510 520 530 540
540 550 560 570 580 590
pF1KE2 AGWQVMVGVGTPFGALLAFVVLINVLQSRSPGHLPKWLQTWDFLPRWMHSLKPLDHLITR
:::.:.::::.: .. .:. . .:::: : ::: ::.:.::: ::.:::: : ....
CCDS34 AGWRVLVGVGVPVVFIIILVLCLRLLQSRCPRVLPKKLQNWNFLPLWMRSLKPWDAVVSK
550 560 570 580 590 600
600 610 620 630
pF1KE2 ATLCCARPEPRSPPLPPRVFLEELPPATPSPRLALPAHHNATRL
: :
CCDS34 FTGCFQMRCCCCCRVCCRACCLLCDCPKCCRCSKCCEDLEEAQEGQDVPVKAPETFDNIT
610 620 630 640 650 660
639 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 03:32:02 2016 done: Tue Nov 8 03:32:03 2016
Total Scan time: 3.930 Total Display time: 0.080
Function used was FASTA [36.3.4 Apr, 2011]