FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2416, 639 aa 1>>>pF1KE2416 639 - 639 aa - 639 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.0029+/-0.000876; mu= 17.4624+/- 0.053 mean_var=94.4882+/-18.765, 0's: 0 Z-trim(109.4): 11 B-trim: 48 in 1/49 Lambda= 0.131943 statistics sampled from 10854 (10859) to 10854 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.688), E-opt: 0.2 (0.334), width: 16 Scan time: 3.930 The best scores are: opt bits E(32554) CCDS4418.1 SLC34A1 gene_id:6569|Hs108|chr5 ( 639) 4193 808.5 0 CCDS54953.1 SLC34A1 gene_id:6569|Hs108|chr5 ( 340) 2020 394.7 1.1e-109 CCDS7038.1 SLC34A3 gene_id:142680|Hs108|chr9 ( 599) 1889 369.9 5.5e-102 CCDS54750.1 SLC34A2 gene_id:10568|Hs108|chr4 ( 689) 1257 249.6 1e-65 CCDS3435.1 SLC34A2 gene_id:10568|Hs108|chr4 ( 690) 1257 249.6 1e-65 >>CCDS4418.1 SLC34A1 gene_id:6569|Hs108|chr5 (639 aa) initn: 4193 init1: 4193 opt: 4193 Z-score: 4314.3 bits: 808.5 E(32554): 0 Smith-Waterman score: 4193; 100.0% identity (100.0% similar) in 639 aa overlap (1-639:1-639) 10 20 30 40 50 60 pF1KE2 MLSYGERLGSPAVSPLPVRGGHVMRGTAFAYVPSPQVLHRIPGTSAYAFPSLGPVALAEH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MLSYGERLGSPAVSPLPVRGGHVMRGTAFAYVPSPQVLHRIPGTSAYAFPSLGPVALAEH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 TCPCGEVLERHEPLPAKLALEEEQKPESRLVPKLRQAGAMLLKVPLMLTFLYLFVCSLDM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 TCPCGEVLERHEPLPAKLALEEEQKPESRLVPKLRQAGAMLLKVPLMLTFLYLFVCSLDM 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 LSSAFQLAGGKVAGDIFKDNAILSNPVAGLVVGILVTVLVQSSSTSTSIIVSMVSSGLLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 LSSAFQLAGGKVAGDIFKDNAILSNPVAGLVVGILVTVLVQSSSTSTSIIVSMVSSGLLE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 VSSAIPIIMGSNIGTSVTNTIVALMQAGDRTDFRRAFAGATVHDCFNWLSVLVLLPLEAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 VSSAIPIIMGSNIGTSVTNTIVALMQAGDRTDFRRAFAGATVHDCFNWLSVLVLLPLEAA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 TGYLHHITRLVVASFNIHGGRDAPDLLKIITEPFTKLIIQLDESVITSIATGDESLRNHS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 TGYLHHITRLVVASFNIHGGRDAPDLLKIITEPFTKLIIQLDESVITSIATGDESLRNHS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 LIQIWCHPDSLQAPTSMSRAEANSSQTLGNATMEKCNHIFVDTGLPDLAVGLILLAGSLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 LIQIWCHPDSLQAPTSMSRAEANSSQTLGNATMEKCNHIFVDTGLPDLAVGLILLAGSLV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 LLCTCLILLVKMLNSLLKGQVAKVIQKVINTDFPAPFTWVTGYFAMVVGASMTFVVQSSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 LLCTCLILLVKMLNSLLKGQVAKVIQKVINTDFPAPFTWVTGYFAMVVGASMTFVVQSSS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 VFTSAITPLIGLGVISIERAYPLTLGSNIGTTTTAILAALASPREKLSSAFQIALCHFFF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 VFTSAITPLIGLGVISIERAYPLTLGSNIGTTTTAILAALASPREKLSSAFQIALCHFFF 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 NISGILLWYPVPCTRLPIRMAKALGKRTAKYRWFAVLYLLVCFLLLPSLVFGISMAGWQV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 NISGILLWYPVPCTRLPIRMAKALGKRTAKYRWFAVLYLLVCFLLLPSLVFGISMAGWQV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 MVGVGTPFGALLAFVVLINVLQSRSPGHLPKWLQTWDFLPRWMHSLKPLDHLITRATLCC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MVGVGTPFGALLAFVVLINVLQSRSPGHLPKWLQTWDFLPRWMHSLKPLDHLITRATLCC 550 560 570 580 590 600 610 620 630 pF1KE2 ARPEPRSPPLPPRVFLEELPPATPSPRLALPAHHNATRL ::::::::::::::::::::::::::::::::::::::: CCDS44 ARPEPRSPPLPPRVFLEELPPATPSPRLALPAHHNATRL 610 620 630 >>CCDS54953.1 SLC34A1 gene_id:6569|Hs108|chr5 (340 aa) initn: 2016 init1: 2016 opt: 2020 Z-score: 2082.7 bits: 394.7 E(32554): 1.1e-109 Smith-Waterman score: 2020; 92.6% identity (96.5% similar) in 339 aa overlap (1-336:1-339) 10 20 30 40 50 60 pF1KE2 MLSYGERLGSPAVSPLPVRGGHVMRGTAFAYVPSPQVLHRIPGTSAYAFPSLGPVALAEH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MLSYGERLGSPAVSPLPVRGGHVMRGTAFAYVPSPQVLHRIPGTSAYAFPSLGPVALAEH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 TCPCGEVLERHEPLPAKLALEEEQKPESRLVPKLRQAGAMLLKVPLMLTFLYLFVCSLDM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 TCPCGEVLERHEPLPAKLALEEEQKPESRLVPKLRQAGAMLLKVPLMLTFLYLFVCSLDM 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 LSSAFQLAGGKVAGDIFKDNAILSNPVAGLVVGILVTVLVQSSSTSTSIIVSMVSSGLLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 LSSAFQLAGGKVAGDIFKDNAILSNPVAGLVVGILVTVLVQSSSTSTSIIVSMVSSGLLE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 VSSAIPIIMGSNIGTSVTNTIVALMQAGDRTDFRRAFAGATVHDCFNWLSVLVLLPLEAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 VSSAIPIIMGSNIGTSVTNTIVALMQAGDRTDFRRAFAGATVHDCFNWLSVLVLLPLEAA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 TGYLHHITRLVVASFNIHGGRDAPDLLKIITEPFTKLIIQLDESVITSIATGDESLRNHS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 TGYLHHITRLVVASFNIHGGRDAPDLLKIITEPFTKLIIQLDESVITSIATGDESLRNHS 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 LIQIWCHPDSLQAPTS---MSRAEANSSQTLGNATMEKCNHIFVDTGLPDLAVGLILLAG :::::::::::: ... . ..:.. .... .: CCDS54 LIQIWCHPDSLQQNLEGREITHFDLRKKQAMEDSSVPHCP 310 320 330 340 360 370 380 390 400 410 pF1KE2 SLVLLCTCLILLVKMLNSLLKGQVAKVIQKVINTDFPAPFTWVTGYFAMVVGASMTFVVQ >>CCDS7038.1 SLC34A3 gene_id:142680|Hs108|chr9 (599 aa) initn: 1861 init1: 1061 opt: 1889 Z-score: 1944.4 bits: 369.9 E(32554): 5.5e-102 Smith-Waterman score: 1896; 51.9% identity (77.2% similar) in 591 aa overlap (41-618:5-584) 20 30 40 50 60 pF1KE2 PAVSPLPVRGGHVMRGTAFAYVPSPQVLHRIPGTSAYAFPSLGPVALAEHT------CPC .:: : :.: : :.:.: CCDS70 MPSSLPG-SQVPHPTLDAVDLVEKTLRNEGTSSS 10 20 30 70 80 90 100 110 120 pF1KE2 GEVLERHEPLPAKLA-LEEEQKP--ESRLVPKLRQAGAMLLKVPLMLTFLYLFVCSLDML . :::. . : : :.. ..: : :.. .::.... .::. .: ::.:.::::.: CCDS70 APVLEEGDTDPWTLPQLKDTSQPWKELRVAGRLRRVAGSVLKACGLLGSLYFFICSLDVL 40 50 60 70 80 90 130 140 150 160 170 180 pF1KE2 SSAFQLAGGKVAGDIFKDNAILSNPVAGLVVGILVTVLVQSSSTSTSIIVSMVSSGLLEV :::::: :.::::::::::..:::::::::.:.:::.::::::::.::.::::.. :: : CCDS70 SSAFQLLGSKVAGDIFKDNVVLSNPVAGLVIGVLVTALVQSSSTSSSIVVSMVAAKLLTV 100 110 120 130 140 150 190 200 210 220 230 240 pF1KE2 SSAIPIIMGSNIGTSVTNTIVALMQAGDRTDFRRAFAGATVHDCFNWLSVLVLLPLEAAT ..::::: :.:::.:.:.:.. :.::: .:.:::.:..:: ::::.::::::::.:: CCDS70 RVSVPIIMGVNVGTSITSTLVSMAQSGDRDEFQRAFSGSAVHGIFNWLTVLVLLPLESAT 160 170 180 190 200 210 250 260 270 280 290 300 pF1KE2 GYLHHITRLVVASFNIHGGRDAPDLLKIITEPFTKLIIQLDESVITSIATGDESLRNHSL . :.....:.... .. .:::.::..:.:.:.::.::: ..: : :::. . : :: CCDS70 ALLERLSELALGAASLTPRAQAPDILKVLTKPLTHLIVQLDSDMIMSSATGNAT--NSSL 220 230 240 250 260 270 310 320 330 340 350 pF1KE2 IQIWCHPDSLQAPTSMSRAEANSSQTLGNATMEK----CNHIFVDTGLPDLAVGLILLAG :. :: . : : : . : :.: : :.:. : : ::::: ::::: CCDS70 IKHWCGTTG-QPTQENSSCGAFGPCTEKNSTAPADRLPCRHLFAGTELTDLAVGCILLAG 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE2 SLVLLCTCLILLVKMLNSLLKGQVAKVIQKVINTDFPAPFTWVTGYFAMVVGASMTFVVQ ::..:: ::.:.::.:::.:.:.::.:.. :::.::: :. :. ::.:...::..::..: CCDS70 SLLVLCGCLVLIVKLLNSVLRGRVAQVVRTVINADFPFPLGWLGGYLAVLAGAGLTFALQ 340 350 360 370 380 390 420 430 440 450 460 470 pF1KE2 SSSVFTSAITPLIGLGVISIERAYPLTLGSNIGTTTTAILAALASPREKLSSAFQIALCH ::::::.:..::.:.::::..::::: :::::::::::.::::::: ... ::.:.:: : CCDS70 SSSVFTAAVVPLMGVGVISLDRAYPLLLGSNIGTTTTALLAALASPADRMLSALQVALIH 400 410 420 430 440 450 480 490 500 510 520 530 pF1KE2 FFFNISGILLWYPVPCTRLPIRMAKALGKRTAKYRWFAVLYLLVCFLLLPSLVFGISMAG ::::..:::::: :: :::: .:. .: ::.::: : .:::. ::::: .::.:.:: CCDS70 FFFNLAGILLWYLVPALRLPIPLARHFGVVTARYRWVAGVYLLLGFLLLPLAAFGLSLAG 460 470 480 490 500 510 540 550 560 570 580 590 pF1KE2 WQVMVGVGTPFGALLAFVVLINVLQSRSPGHLPKWLQTWDFLPRWMHSLKPLDHLITRAT . ...:: :. .:. .:.:..::: : :. :: :..: .:: :.:::.: :.:.:: CCDS70 GMELAAVGGPLVGLVLLVILVTVLQRRRPAWLPVRLRSWAWLPVWLHSLEPWDRLVTR-- 520 530 540 550 560 600 610 620 630 pF1KE2 LCCARPEPRSPPLPPRVFLEELPPATPSPRLALPAHHNATRL :: : . ::.. .: CCDS70 -CC----PCNVCSPPKATTKEAYCYENPEILASQQL 570 580 590 >>CCDS54750.1 SLC34A2 gene_id:10568|Hs108|chr4 (689 aa) initn: 2194 init1: 1250 opt: 1257 Z-score: 1293.4 bits: 249.6 E(32554): 1e-65 Smith-Waterman score: 2176; 64.8% identity (87.0% similar) in 514 aa overlap (103-599:99-612) 80 90 100 110 120 130 pF1KE2 PLPAKLALEEEQKPESRLVPKLRQAGAMLLKVPLMLTFLYLFVCSLDMLSSAFQLAGGKV .. :.: :::.::::::.:::::::.:::. CCDS54 WNLPTLQDSGIKWSERDTKGKILCFFQGIGRLILLLGFLYFFVCSLDILSSAFQLVGGKM 70 80 90 100 110 120 140 150 160 170 180 190 pF1KE2 AGDIFKDNAILSNPVAGLVVGILVTVLVQSSSTSTSIIVSMVSSGLLEVSSAIPIIMGSN ::..:....:.:::. :::.:.:::::::::::::::.::::::.:: : .:::::::.: CCDS54 AGQFFSNSSIMSNPLLGLVIGVLVTVLVQSSSTSTSIVVSMVSSSLLTVRAAIPIIMGAN 130 140 150 160 170 180 200 210 220 230 240 250 pF1KE2 IGTSVTNTIVALMQAGDRTDFRRAFAGATVHDCFNWLSVLVLLPLEAATGYLHHITRLVV ::::.:::::::::.:::..:::::::::::: :::::::::::.:.:: ::. ::.:.: CCDS54 IGTSITNTIVALMQVGDRSEFRRAFAGATVHDFFNWLSVLVLLPVEVATHYLEIITQLIV 190 200 210 220 230 240 260 270 280 290 300 pF1KE2 ASFNIHGGRDAPDLLKIITEPFTKLIIQLDESVITSIATGDESLRNHSLIQIWCH----- ::....:.:::::::.::.::::::.:::..::..:: .::. .:.::..:::. CCDS54 ESFHFKNGEDAPDLLKVITKPFTKLIVQLDKKVISQIAMNDEKAKNKSLVKIWCKTFTNK 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 -------PDSLQAPT-SMSRAEANSSQTLGNATME----KCNHIFVDTGLPDLAVGLILL :.. . . :. ... .. :. :.:.. ::.::::. ::::::: ::: CCDS54 TQINVTVPSTANCTSPSLCWTDGIQNWTMKNVTYKENIAKCQHIFVNFHLPDLAVGTILL 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE2 AGSLVLLCTCLILLVKMLNSLLKGQVAKVIQKVINTDFPAPFTWVTGYFAMVVGASMTFV ::..:: :::..::.:.:.:::::: ::.:.:::::: ::.:.:::.:..:::.:::. CCDS54 ILSLLVLCGCLIMIVKILGSVLKGQVATVIKKTINTDFPFPFAWLTGYLAILVGAGMTFI 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE2 VQSSSVFTSAITPLIGLGVISIERAYPLTLGSNIGTTTTAILAALASPREKLSSAFQIAL ::::::::::.:::::.:::.::::::::::::::::::::::::::: . : :..:::: CCDS54 VQSSSVFTSALTPLIGIGVITIERAYPLTLGSNIGTTTTAILAALASPGNALRSSLQIAL 430 440 450 460 470 480 480 490 500 510 520 530 pF1KE2 CHFFFNISGILLWYPVPCTRLPIRMAKALGKRTAKYRWFAVLYLLVCFLLLPSLVFGISM :::::::::::::::.: :::::::::.::. .::::::::.::.. :.:.: :::.:. CCDS54 CHFFFNISGILLWYPIPFTRLPIRMAKGLGNISAKYRWFAVFYLIIFFFLIPLTVFGLSL 490 500 510 520 530 540 540 550 560 570 580 590 pF1KE2 AGWQVMVGVGTPFGALLAFVVLINVLQSRSPGHLPKWLQTWDFLPRWMHSLKPLDHLITR :::.:.::::.: .. .:. . .:::: : ::: ::.:.::: ::.:::: : .... CCDS54 AGWRVLVGVGVPVVFIIILVLCLRLLQSRCPRVLPKKLQNWNFLPLWMRSLKPWDAVVSK 550 560 570 580 590 600 600 610 620 630 pF1KE2 ATLCCARPEPRSPPLPPRVFLEELPPATPSPRLALPAHHNATRL : : CCDS54 FTGCFQMRCCCCCRVCCRACCLLCDCPKCCRCSKCCEDLEEAQEGQDVPVKAPETFDNIT 610 620 630 640 650 660 >>CCDS3435.1 SLC34A2 gene_id:10568|Hs108|chr4 (690 aa) initn: 2194 init1: 1250 opt: 1257 Z-score: 1293.4 bits: 249.6 E(32554): 1e-65 Smith-Waterman score: 2176; 64.8% identity (87.0% similar) in 514 aa overlap (103-599:100-613) 80 90 100 110 120 130 pF1KE2 PLPAKLALEEEQKPESRLVPKLRQAGAMLLKVPLMLTFLYLFVCSLDMLSSAFQLAGGKV .. :.: :::.::::::.:::::::.:::. CCDS34 WNLPTLQDSGIKWSERDTKGKILCFFQGIGRLILLLGFLYFFVCSLDILSSAFQLVGGKM 70 80 90 100 110 120 140 150 160 170 180 190 pF1KE2 AGDIFKDNAILSNPVAGLVVGILVTVLVQSSSTSTSIIVSMVSSGLLEVSSAIPIIMGSN ::..:....:.:::. :::.:.:::::::::::::::.::::::.:: : .:::::::.: CCDS34 AGQFFSNSSIMSNPLLGLVIGVLVTVLVQSSSTSTSIVVSMVSSSLLTVRAAIPIIMGAN 130 140 150 160 170 180 200 210 220 230 240 250 pF1KE2 IGTSVTNTIVALMQAGDRTDFRRAFAGATVHDCFNWLSVLVLLPLEAATGYLHHITRLVV ::::.:::::::::.:::..:::::::::::: :::::::::::.:.:: ::. ::.:.: CCDS34 IGTSITNTIVALMQVGDRSEFRRAFAGATVHDFFNWLSVLVLLPVEVATHYLEIITQLIV 190 200 210 220 230 240 260 270 280 290 300 pF1KE2 ASFNIHGGRDAPDLLKIITEPFTKLIIQLDESVITSIATGDESLRNHSLIQIWCH----- ::....:.:::::::.::.::::::.:::..::..:: .::. .:.::..:::. CCDS34 ESFHFKNGEDAPDLLKVITKPFTKLIVQLDKKVISQIAMNDEKAKNKSLVKIWCKTFTNK 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 -------PDSLQAPT-SMSRAEANSSQTLGNATME----KCNHIFVDTGLPDLAVGLILL :.. . . :. ... .. :. :.:.. ::.::::. ::::::: ::: CCDS34 TQINVTVPSTANCTSPSLCWTDGIQNWTMKNVTYKENIAKCQHIFVNFHLPDLAVGTILL 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE2 AGSLVLLCTCLILLVKMLNSLLKGQVAKVIQKVINTDFPAPFTWVTGYFAMVVGASMTFV ::..:: :::..::.:.:.:::::: ::.:.:::::: ::.:.:::.:..:::.:::. CCDS34 ILSLLVLCGCLIMIVKILGSVLKGQVATVIKKTINTDFPFPFAWLTGYLAILVGAGMTFI 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE2 VQSSSVFTSAITPLIGLGVISIERAYPLTLGSNIGTTTTAILAALASPREKLSSAFQIAL ::::::::::.:::::.:::.::::::::::::::::::::::::::: . : :..:::: CCDS34 VQSSSVFTSALTPLIGIGVITIERAYPLTLGSNIGTTTTAILAALASPGNALRSSLQIAL 430 440 450 460 470 480 480 490 500 510 520 530 pF1KE2 CHFFFNISGILLWYPVPCTRLPIRMAKALGKRTAKYRWFAVLYLLVCFLLLPSLVFGISM :::::::::::::::.: :::::::::.::. .::::::::.::.. :.:.: :::.:. CCDS34 CHFFFNISGILLWYPIPFTRLPIRMAKGLGNISAKYRWFAVFYLIIFFFLIPLTVFGLSL 490 500 510 520 530 540 540 550 560 570 580 590 pF1KE2 AGWQVMVGVGTPFGALLAFVVLINVLQSRSPGHLPKWLQTWDFLPRWMHSLKPLDHLITR :::.:.::::.: .. .:. . .:::: : ::: ::.:.::: ::.:::: : .... CCDS34 AGWRVLVGVGVPVVFIIILVLCLRLLQSRCPRVLPKKLQNWNFLPLWMRSLKPWDAVVSK 550 560 570 580 590 600 600 610 620 630 pF1KE2 ATLCCARPEPRSPPLPPRVFLEELPPATPSPRLALPAHHNATRL : : CCDS34 FTGCFQMRCCCCCRVCCRACCLLCDCPKCCRCSKCCEDLEEAQEGQDVPVKAPETFDNIT 610 620 630 640 650 660 639 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 03:32:02 2016 done: Tue Nov 8 03:32:03 2016 Total Scan time: 3.930 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]