FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1072, 771 aa 1>>>pF1KE1072 771 - 771 aa - 771 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.9509+/-0.00116; mu= 17.0544+/- 0.069 mean_var=72.8659+/-14.835, 0's: 0 Z-trim(101.7): 38 B-trim: 0 in 0/47 Lambda= 0.150249 statistics sampled from 6585 (6616) to 6585 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.541), E-opt: 0.2 (0.203), width: 16 Scan time: 3.290 The best scores are: opt bits E(32554) CCDS33892.1 SLC7A14 gene_id:57709|Hs108|chr3 ( 771) 5029 1100.1 0 CCDS33608.1 SLC7A4 gene_id:6545|Hs108|chr22 ( 635) 1204 271.0 4.2e-72 CCDS14404.1 SLC7A3 gene_id:84889|Hs108|chrX ( 619) 820 187.8 4.7e-47 CCDS9333.1 SLC7A1 gene_id:6541|Hs108|chr13 ( 629) 812 186.0 1.6e-46 CCDS34852.1 SLC7A2 gene_id:6542|Hs108|chr8 ( 658) 779 178.9 2.3e-44 CCDS55203.1 SLC7A2 gene_id:6542|Hs108|chr8 ( 698) 779 178.9 2.5e-44 CCDS6002.2 SLC7A2 gene_id:6542|Hs108|chr8 ( 697) 757 174.1 6.7e-43 CCDS9590.1 SLC7A8 gene_id:23428|Hs108|chr14 ( 535) 287 72.2 2.5e-12 >>CCDS33892.1 SLC7A14 gene_id:57709|Hs108|chr3 (771 aa) initn: 5029 init1: 5029 opt: 5029 Z-score: 5887.5 bits: 1100.1 E(32554): 0 Smith-Waterman score: 5029; 100.0% identity (100.0% similar) in 771 aa overlap (1-771:1-771) 10 20 30 40 50 60 pF1KE1 MSGFFTSLDPRRVQWGAAWYAMHSRILRTKPVESMLEGTGTTTAHGTKLAQVLTTVDLIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MSGFFTSLDPRRVQWGAAWYAMHSRILRTKPVESMLEGTGTTTAHGTKLAQVLTTVDLIS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 LGVGSCVGTGMYVVSGLVAKEMAGPGVIVSFIIAAVASILSGVCYAEFGVRVPKTTGSAY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LGVGSCVGTGMYVVSGLVAKEMAGPGVIVSFIIAAVASILSGVCYAEFGVRVPKTTGSAY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 TYSYVTVGEFVAFFIGWNLILEYLIGTAAGASALSSMFDSLANHTISRWMADSVGTLNGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TYSYVTVGEFVAFFIGWNLILEYLIGTAAGASALSSMFDSLANHTISRWMADSVGTLNGL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 GKGEESYPDLLALLIAVIVTIIVALGVKNSIGFNNVLNVLNLAVWVFIMIAGLFFINGKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GKGEESYPDLLALLIAVIVTIIVALGVKNSIGFNNVLNVLNLAVWVFIMIAGLFFINGKY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 WAEGQFLPHGWSGVLQGAATCFYAFIGFDIIATTGEEAKNPNTSIPYAITASLVICLTAY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 WAEGQFLPHGWSGVLQGAATCFYAFIGFDIIATTGEEAKNPNTSIPYAITASLVICLTAY 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 VSVSVILTLMVPYYTIDTESPLMEMFVAHGFYAAKFVVAIGSVAGLTVSLLGSLFPMPRV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VSVSVILTLMVPYYTIDTESPLMEMFVAHGFYAAKFVVAIGSVAGLTVSLLGSLFPMPRV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE1 IYAMAGDGLLFRFLAHVSSYTETPVVACIVSGFLAALLALLVSLRDLIEMMSIGTLLAYT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 IYAMAGDGLLFRFLAHVSSYTETPVVACIVSGFLAALLALLVSLRDLIEMMSIGTLLAYT 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE1 LVSVCVLLLRYQPESDIDGFVKFLSEEHTKKKEGILADCEKEACSPVSEGDEFSGPATNT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LVSVCVLLLRYQPESDIDGFVKFLSEEHTKKKEGILADCEKEACSPVSEGDEFSGPATNT 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE1 CGAKNLPSLGDNEMLIGKSDKSTYNVNHPNYGTVDMTTGIEADESENIYLIKLKKLIGPH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 CGAKNLPSLGDNEMLIGKSDKSTYNVNHPNYGTVDMTTGIEADESENIYLIKLKKLIGPH 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE1 YYTMRIRLGLPGKMDRPTAATGHTVTICVLLLFILMFIFCSFIIFGSDYISEQSWWAILL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 YYTMRIRLGLPGKMDRPTAATGHTVTICVLLLFILMFIFCSFIIFGSDYISEQSWWAILL 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE1 VVLMVLLISTLVFVILQQPENPKKLPYMAPCLPFVPAFAMLVNIYLMLKLSTITWIRFAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VVLMVLLISTLVFVILQQPENPKKLPYMAPCLPFVPAFAMLVNIYLMLKLSTITWIRFAV 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE1 WCFVGLLIYFGYGIWNSTLEISAREEALHQSTYQRYDVDDPFSVEEGFSYATEGESQEDW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 WCFVGLLIYFGYGIWNSTLEISAREEALHQSTYQRYDVDDPFSVEEGFSYATEGESQEDW 670 680 690 700 710 720 730 740 750 760 770 pF1KE1 GGPTEDKGFYYQQMSDAKANGRTSSKAKSKSKHKQNSEALIANDELDYSPE ::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GGPTEDKGFYYQQMSDAKANGRTSSKAKSKSKHKQNSEALIANDELDYSPE 730 740 750 760 770 >>CCDS33608.1 SLC7A4 gene_id:6545|Hs108|chr22 (635 aa) initn: 1055 init1: 815 opt: 1204 Z-score: 1407.9 bits: 271.0 E(32554): 4.2e-72 Smith-Waterman score: 1387; 37.8% identity (65.4% similar) in 709 aa overlap (25-728:17-632) 10 20 30 40 50 pF1KE1 MSGFFTSLDPRRVQWGAAWYAMHSRILRTKPVE-SMLEGTGTTTAHGTKLAQVLTTVDLI .. : ::.: : .: :.: . :.:.:: CCDS33 MARGLPTIASLARLCQKLNRLKPLEDSTME---------TSLRRCLSTLDLT 10 20 30 40 60 70 80 90 100 110 pF1KE1 SLGVGSCVGTGMYVVSGLVAKEMAGPGVIVSFIIAAVASILSGVCYAEFGVRVPKTTGSA ::::. ::.:.::..: ::::.:::.:..:: .:::::.:...::::::.:::.: ::: CCDS33 LLGVGGMVGSGLYVLTGAVAKEVAGPAVLLSFGVAAVASLLAALCYAEFGARVPRT-GSA 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE1 YTYSYVTVGEFVAFFIGWNLILEYLIGTAAGASALSSMFDSLANHTISRWMADSVGTLNG : ..::..::. ::.::::..:::.:: :: : : :...::. .:.: . ::. . CCDS33 YLFTYVSMGELWAFLIGWNVLLEYIIGGAAVARAWSGYLDSMFSHSIRNFTETHVGSWQV 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE1 LGKGEESYPDLLALLIAVIVTIIVALGVKNSIGFNNVLNVLNLAVWVFIMIAGLFFINGK :. :::.:: : .... .:. :.. : .:.......: : .::.: :... . . CCDS33 PLLGH--YPDFLAAGIILLASAFVSCGARVSSWLNHTFSAISLLVILFIVILGFILAQPH 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE1 YWA--EGQFLPHGWSGVLQGAATCFYAFIGFDIIATTGEEAKNPNTSIPYAITASLVICL :. :: : : :.:::. :.:.:::::.:::.::...:::.:: :.: ::. ::.: CCDS33 NWSADEGGFAPFGFSGVMAGTASCFYAFVGFDVIAASSEEAQNPRRSVPLAIAISLAIAA 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE1 TAYVSVSVILTLMVPYYTIDTESPLMEMFVAHGFYAAKFVVAIGSVAGLTVSLLGSLFPM ::. ::..::::::....: .: : . : .:. : :.:: ::. .... ::. :: . CCDS33 GAYILVSTVLTLMVPWHSLDPDSALADAFYQRGYRWAGFIVAAGSICAMNTVLLSLLFSL 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE1 PRVIYAMAGDGLLFRFLAHVSSYTETPVVACIVSGFLAALLALLVSLRDLIEMMSIGTLL ::..::::.:::.:. .::: :..::.. .. :.:.:.::::..:..:....:.:::: CCDS33 PRIVYAMAADGLFFQVFAHVHPRTQVPVAGTLAFGLLTAFLALLLDLESLVQFLSLGTLL 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE1 AYTLVSVCVLLLRYQPESDIDGFVKFLSEEHTKKKEGILADCEKEACSPVSEGDEFSGPA :::.:.. ...::.: : : : : :: CCDS33 AYTFVATSIIVLRFQKSSP-----------------------------PSSPGPASPGPL 410 420 430 480 490 500 510 520 530 pF1KE1 TNTCGAKNLPSLGDNEMLIGKSDKSTYNVNHPNYGTVDMTTGIEADESENIYLIKLKKLI : :. :..:. .:.: : ... :. : .:: . CCDS33 T-----KQQSSFSDHLQLVG-----TVHASVPEPG-------------------ELKPAL 440 450 460 540 550 560 570 580 590 pF1KE1 GPHYYTMRIRLGLPGKMDRPTAATGHTVTICVLLLFILMFIFCSFIIFGSDYISEQSWWA :. ::. .: . : .:: . ... . . ..::.. . : CCDS33 RPY-------LGF---LD--GYSPGAVVTWALGVMLASAITIGCVLVFGNSTLHLPHWGY 470 480 490 500 510 600 610 620 630 640 650 pF1KE1 ILLVVL--MVLLISTLVFVILQQPENPKKLPYMAPCLPFVPAFAMLVNIYLMLKLSTITW :::..: ...:.: ::. :: .. .. : .:..::.....:: :::::: .:: CCDS33 ILLLLLTSVMFLLSLLVLGAHQQQY--REDLFQIPMVPLIPALSIVLNICLMLKLSYLTW 520 530 540 550 560 660 670 680 690 700 710 pF1KE1 IRFAVWCFVGLLIYFGYGIWNSTLEISAREEALHQSTYQRYDVDDPFSVEEGFSYATEGE .::..: ..:: .:::::: .: . . :: .::. : : :.:: . : . CCDS33 VRFSIWLLMGLAVYFGYGIRHS--KENQRELPGLNSTH--YVVFPRGSLEETVQ-AMQPP 570 580 590 600 610 620 720 730 740 750 760 770 pF1KE1 SQEDWGGPTEDKGFYYQQMSDAKANGRTSSKAKSKSKHKQNSEALIANDELDYSPE :: .:..: : CCDS33 SQ----APAQDPGHME 630 >>CCDS14404.1 SLC7A3 gene_id:84889|Hs108|chrX (619 aa) initn: 1684 init1: 813 opt: 820 Z-score: 958.3 bits: 187.8 E(32554): 4.7e-47 Smith-Waterman score: 1502; 40.8% identity (64.9% similar) in 679 aa overlap (47-699:26-610) 20 30 40 50 60 70 pF1KE1 AAWYAMHSRILRTKPVESMLEGTGTTTAHGTKLAQVLTTVDLISLGVGSCVGTGMYVVSG :.::. :.:.::..::::: .:.:.::..: CCDS14 MPWQAFRRFGQKLVRRRTLESGMAETRLARCLSTLDLVALGVGSTLGAGVYVLAG 10 20 30 40 50 80 90 100 110 120 130 pF1KE1 LVAKEMAGPGVIVSFIIAAVASILSGVCYAEFGVRVPKTTGSAYTYSYVTVGEFVAFFIG :::. :::.... :..::..:.:.:.::::::.:::.. :::: ::::::::. :: : CCDS14 EVAKDKAGPSIVICFLVAALSSVLAGLCYAEFGARVPRS-GSAYLYSYVTVGELWAFTTG 60 70 80 90 100 110 140 150 160 170 180 190 pF1KE1 WNLILEYLIGTAAGASALSSMFDSLANHTISRWMADSVGTLNGLGKGEESYPDLLALLIA ::::: :.::::. : : :: ::.: .. ::. . :.. . . :::..:: .. CCDS14 WNLILSYVIGTASVARAWSSAFDNLIGNHISKTLQGSIAL--HVPHVLAEYPDFFALGLV 120 130 140 150 160 170 200 210 220 230 240 pF1KE1 VIVTIIVALGVKNSIGFNNVLNVLNLAVWVFIMIAGLFFINGKY--W-----------AE ...: ..:::...: ..:.. .:: : :.::.: :..: : :: CCDS14 LLLTGLLALGASESALVTKVFTGVNLLVLGFVMISG--FVKGDVHNWKLTEEDYELAMAE 180 190 200 210 220 230 250 260 270 280 290 pF1KE1 ------------GQFLPHGWSGVLQGAATCFYAFIGFDIIATTGEEAKNPNTSIPYAITA : :.: :. :.:.:::::::::.::: ::::::::.::. :::..:. CCDS14 LNDTYSLGPLGSGGFVPFGFEGILRGAATCFYAFVGFDCIATTGEEAQNPQRSIPMGIVI 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE1 SLVICLTAYVSVSVILTLMVPYYTIDTESPLMEMFVAHGFYAAKFVVAIGSVAGLTVSLL :: .:. :: .:: ::::.::: .. :::: : :. :. :..:::.::. .:..::: CCDS14 SLSVCFLAYFAVSSALTLMMPYYQLQPESPLPEAFLYIGWAPARYVVAVGSLCALSTSLL 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE1 GSLFPMPRVIYAMAGDGLLFRFLAHVSSYTETPVVACIVSGFLAALLALLVSLRDLIEMM ::.::::::::::: :::::: ::.. . :.::..: .:::..::..:.: .: ::...: CCDS14 GSMFPMPRVIYAMAEDGLLFRVLARIHTGTRTPIIATVVSGIIAAFMAFLFKLTDLVDLM 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE1 SIGTLLAYTLVSVCVLLLRYQPESDIDGFVKFLSEEHTKKKEGILADCEKEACSPVSEGD ::::::::.:::.:::.:::::... : : .. ..:: CCDS14 SIGTLLAYSLVSICVLILRYQPDQET--------------KTGEEVELQEEA-------- 420 430 440 480 490 500 510 520 530 pF1KE1 EFSGPATNTCGAKNLPSLGDNEMLIGKSDKSTYNVNHPNYGTVDMTTGIEADESENIYLI .:: :::.. : CCDS14 --------------------------------------------ITT-----ESEKLTLW 450 540 550 560 570 580 590 pF1KE1 KLKKLIGPHYYTMRIRLGLPGKMDRPTAATGHTVTICVLLLFILMFIFCSFII-FGSDYI : .. . . :: .:. : .: :: .:. .: . .. . CCDS14 GL-------FFPLN---------SIPTPLSGQIVYVCSSLLAVLLTALCLVLAQWSVPLL 460 470 480 490 500 600 610 620 630 640 650 pF1KE1 SEQSWWAILLVVLMVLLISTLVFVILQQPENPKKLPYMAPCLPFVPAFAMLVNIYLMLKL : . :. . :::..::: .. :: .::.. : . .: ::..: ....::::::... CCDS14 SGDLLWTAV-VVLLLLLIIGIIVVIWRQPQSSTPLHFKVPALPLLPLMSIFVNIYLMMQM 510 520 530 540 550 560 660 670 680 690 700 710 pF1KE1 STITWIRFAVWCFVGLLIYFGYGIWNSTLEISAREEALHQSTYQRYDVDDPFSVEEGFSY .. :: ::.:: ..:. ::::::: .: ::.. . . ..: . :.: CCDS14 TAGTWARFGVWMLIGFAIYFGYGIQHSLEEIKSNQPS-RKSRAKTVDLDPGTLYVHSV 570 580 590 600 610 720 730 740 750 760 770 pF1KE1 ATEGESQEDWGGPTEDKGFYYQQMSDAKANGRTSSKAKSKSKHKQNSEALIANDELDYSP >>CCDS9333.1 SLC7A1 gene_id:6541|Hs108|chr13 (629 aa) initn: 1705 init1: 812 opt: 812 Z-score: 948.8 bits: 186.0 E(32554): 1.6e-46 Smith-Waterman score: 1597; 42.9% identity (69.8% similar) in 658 aa overlap (47-677:26-608) 20 30 40 50 60 70 pF1KE1 AAWYAMHSRILRTKPVESMLEGTGTTTAHGTKLAQVLTTVDLISLGVGSCVGTGMYVVSG :.:.. :.: ::..::::: .:.:.::..: CCDS93 MGCKVLLNIGQQMLRRKVVDCSREETRLSRCLNTFDLVALGVGSTLGAGVYVLAG 10 20 30 40 50 80 90 100 110 120 130 pF1KE1 LVAKEMAGPGVIVSFIIAAVASILSGVCYAEFGVRVPKTTGSAYTYSYVTVGEFVAFFIG ::.: :::....::.:::.::.:.:.::.:::.::::: :::: ::::::::. ::. : CCDS93 AVARENAGPAIVISFLIAALASVLAGLCYGEFGARVPKT-GSAYLYSYVTVGELWAFITG 60 70 80 90 100 110 140 150 160 170 180 190 pF1KE1 WNLILEYLIGTAAGASALSSMFDSLANHTISRWMADSVGTLNGLGKGEESYPDLLALLIA ::::: :.:::.. : : :. :: : .. :... . :::. : :. ::..:..: CCDS93 WNLILSYIIGTSSVARAWSATFDELIGRPIGEFSRTHM-TLNAPGVLAEN-PDIFAVIII 120 130 140 150 160 170 200 210 220 230 240 pF1KE1 VIVTIIVALGVKNSIGFNNVLNVLNLAVWVFIMIAGLFFING--KYWA------------ .:.: ...::::.: :.... .:. : :::..: :..: : : CCDS93 LILTGLLTLGVKESAMVNKIFTCINVLVLGFIMVSG--FVKGSVKNWQLTEEDFGNTSGR 180 190 200 210 220 230 250 260 270 280 pF1KE1 --------EGQ-----FLPHGWSGVLQGAATCFYAFIGFDIIATTGEEAKNPNTSIPYAI ::. :.: :.::::.:::::::::.::: :::::::.:::. .:: .: CCDS93 LCLNNDTKEGKPGVGGFMPFGFSGVLSGAATCFYAFVGFDCIATTGEEVKNPQKAIPVGI 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE1 TASLVICLTAYVSVSVILTLMVPYYTIDTESPLMEMFVAHGFYAAKFVVAIGSVAGLTVS .:::.::. :: .::. ::::.::. .:..::: . : :. .::..::.::. .:..: CCDS93 VASLLICFIAYFGVSAALTLMMPYFCLDNNSPLPDAFKHVGWEGAKYAVAVGSLCALSAS 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE1 LLGSLFPMPRVIYAMAGDGLLFRFLAHVSSYTETPVVACIVSGFLAALLALLVSLRDLIE ::::.::::::::::: :::::.:::.:.. :.::..: ..:: .::..:.: .:.::.. CCDS93 LLGSMFPMPRVIYAMAEDGLLFKFLANVNDRTKTPIIATLASGAVAAVMAFLFDLKDLVD 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE1 MMSIGTLLAYTLVSVCVLLLRYQPESDIDGFVKFLSEEHTKKKEGILADCEKEACSPVSE .:::::::::.::..:::.::::::. ..: .. : CCDS93 LMSIGTLLAYSLVAACVLVLRYQPEQP--NLVYQMA----------------------ST 420 430 440 470 480 490 500 510 520 pF1KE1 GDEFSGPATNTCGAKNLPSLGDNEMLIGKSDKSTYNVNHPNYGTVDMTTGIEADESENIY .::.. :: .. .: : .:... : . :.: CCDS93 SDELD-PADQN----ELASTNDSQL-----------------GFLP--------EAE--- 450 460 470 530 540 550 560 570 580 pF1KE1 LIKLKKLIGPHYYTMRIRLGLPGKMDRPTAATGHTVTICVLLLFILMFIFCSFIIFGSDY ...:: ...: : .:. .: :.: . :. .:.. :: ..: . CCDS93 MFSLKTILSP-------------KNMEPSKISGLIVNISTSLIAVLIITFCIVTVLGREA 480 490 500 510 520 590 600 610 620 630 640 pF1KE1 ISEQSWWAILLVVLMVLLISTLVFVILQQPENPKKLPYMAPCLPFVPAFAMLVNIYLMLK ... . ::..:.. .:: .... :: .:::. :: . .: :: .: ....::.:::.. CCDS93 LTKGALWAVFLLAGSALLCAVVTGVIWRQPESKTKLSFKVPFLPVLPILSIFVNVYLMMQ 530 540 550 560 570 580 650 660 670 680 690 700 pF1KE1 LSTITWIRFAVWCFVGLLIYFGYGIWNSTLEISAREEALHQSTYQRYDVDDPFSVEEGFS :. ::.::::: ..:..::::::.:.: CCDS93 LDQGTWVRFAVWMLIGFIIYFGYGLWHSEEASLDADQARTPDGNLDQCK 590 600 610 620 >>CCDS34852.1 SLC7A2 gene_id:6542|Hs108|chr8 (658 aa) initn: 1602 init1: 777 opt: 779 Z-score: 909.8 bits: 178.9 E(32554): 2.3e-44 Smith-Waterman score: 1547; 41.6% identity (67.2% similar) in 673 aa overlap (47-693:28-621) 20 30 40 50 60 70 pF1KE1 AAWYAMHSRILRTKPVESMLEGTGTTTAHGTKLAQVLTTVDLISLGVGSCVGTGMYVVSG ::: . :.:.:::.::::: .:.:.::..: CCDS34 MIPCRAALTFARCLIRRKIVTLDSLEDTKLCRCLSTMDLIALGVGSTLGAGVYVLAG 10 20 30 40 50 80 90 100 110 120 130 pF1KE1 LVAKEMAGPGVIVSFIIAAVASILSGVCYAEFGVRVPKTTGSAYTYSYVTVGEFVAFFIG ::: .::...:::.:::.::...:.::::::.::::: :::: :.::::::. ::. : CCDS34 EVAKADSGPSIVVSFLIAALASVMAGLCYAEFGARVPKT-GSAYLYTYVTVGELWAFITG 60 70 80 90 100 110 140 150 160 170 180 190 pF1KE1 WNLILEYLIGTAAGASALSSMFDSLANHTISRWMADSVGTLNGLGKGEESYPDLLALLIA ::::: :.:::.. : : :. :: : .. :.... . .: : .: :::..:. . CCDS34 WNLILSYVIGTSSVARAWSGTFDELLSKQIGQFLR-TYFRMNYTGLAE--YPDFFAVCLI 120 130 140 150 160 170 200 210 220 230 240 pF1KE1 VIVTIIVALGVKNSIGFNNVLNVLNLAVWVFIMIAGLFFINGKYW--------------- .... ....:::.: :.:....:. : .:.:.::. : : CCDS34 LLLAGLLSFGVKESAWVNKVFTAVNILVLLFVMVAGFVKGNVANWKISEEFLKNISASAR 180 190 200 210 220 230 250 260 270 280 290 pF1KE1 -----------AEGQFLPHGWSGVLQGAATCFYAFIGFDIIATTGEEAKNPNTSIPYAIT . : :.:.:..:.: :::::::::.::: :::::::..::. .:: .:. CCDS34 EPPSENGTSIYGAGGFMPYGFTGTLAGAATCFYAFVGFDCIATTGEEVRNPQKAIPIGIV 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE1 ASLVICLTAYVSVSVILTLMVPYYTIDTESPLMEMFVAHGFYAAKFVVAIGSVAGLTVSL .::..:. :: .::. ::::.::: .: .::: : :. ::.::: ::. .:..:: CCDS34 TSLLVCFMAYFGVSAALTLMMPYYLLDEKSPLPVAFEYVGWGPAKYVVAAGSLCALSTSL 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE1 LGSLFPMPRVIYAMAGDGLLFRFLAHVSSYTETPVVACIVSGFLAALLALLVSLRDLIEM :::.::::::::::: :::::. ::...: :.::..: . :: .:::.:.: .:. :..: CCDS34 LGSIFPMPRVIYAMAEDGLLFKCLAQINSKTKTPIIATLSSGAVAALMAFLFDLKALVDM 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE1 MSIGTLLAYTLVSVCVLLLRYQPESDIDGFVKFLSEEHTKKKEGILADCEKEACSPVSEG ::::::.::.::..:::.::::: :. : : ::: ..: CCDS34 MSIGTLMAYSLVAACVLILRYQP--------------------GLSYDQPK--CSPEKDG 420 430 440 450 480 490 500 510 520 530 pF1KE1 DEFSGPATNTCGAKNLPSLGDNEMLIGKSDKSTYNVNHPNYGTVDMTTGIEADESENIYL ::.. . .:: ::. .: CCDS34 ------------------LGSSPRVTSKS------------------------ESQVTML 460 540 550 560 570 580 590 pF1KE1 IKLKKLIGPHYYTMRIRLGLPGKMDRPTAATGHTVTICVLLLFILMFIFCSFIIFGSDYI . . ..:: : :. . :: .. :.. : .: .:.. . . .: : CCDS34 QR-------QGFSMRT-LFCPSLL--PTQQSASLVSFLVGFLAFLVLGLSVLTTYGVHAI 470 480 490 500 510 600 610 620 630 640 650 pF1KE1 SEQSWWAILLVVLMVLLISTLVFVILQQPENPKKLPYMAPCLPFVPAFAMLVNIYLMLKL .. :.. :..:...:. ..:..: .::.: .:. .:.: :::.:::..:::::::..: CCDS34 TRLEAWSLALLALFLVLFVAIVLTIWRQPQNQQKVAFMVPFLPFLPAFSILVNIYLMVQL 520 530 540 550 560 570 660 670 680 690 700 710 pF1KE1 STITWIRFAVWCFVGLLIYFGYGIWNSTLEISAREEALHQSTYQRYDVDDPFSVEEGFSY :. ::.::..: .:.::::.::: .: :: :.: ....: CCDS34 SADTWVRFSIWMAIGFLIYFSYGIRHS-LEGHLRDENNEEDAYPDNVHAAAEEKSAIQAN 580 590 600 610 620 630 720 730 740 750 760 770 pF1KE1 ATEGESQEDWGGPTEDKGFYYQQMSDAKANGRTSSKAKSKSKHKQNSEALIANDELDYSP CCDS34 DHHPRNLSSPFIFHEKTSEF 640 650 >>CCDS55203.1 SLC7A2 gene_id:6542|Hs108|chr8 (698 aa) initn: 1602 init1: 777 opt: 779 Z-score: 909.4 bits: 178.9 E(32554): 2.5e-44 Smith-Waterman score: 1547; 41.6% identity (67.2% similar) in 673 aa overlap (47-693:68-661) 20 30 40 50 60 70 pF1KE1 AAWYAMHSRILRTKPVESMLEGTGTTTAHGTKLAQVLTTVDLISLGVGSCVGTGMYVVSG ::: . :.:.:::.::::: .:.:.::..: CCDS55 DVRMIPCRAALTFARCLIRRKIVTLDSLEDTKLCRCLSTMDLIALGVGSTLGAGVYVLAG 40 50 60 70 80 90 80 90 100 110 120 130 pF1KE1 LVAKEMAGPGVIVSFIIAAVASILSGVCYAEFGVRVPKTTGSAYTYSYVTVGEFVAFFIG ::: .::...:::.:::.::...:.::::::.::::: :::: :.::::::. ::. : CCDS55 EVAKADSGPSIVVSFLIAALASVMAGLCYAEFGARVPKT-GSAYLYTYVTVGELWAFITG 100 110 120 130 140 150 140 150 160 170 180 190 pF1KE1 WNLILEYLIGTAAGASALSSMFDSLANHTISRWMADSVGTLNGLGKGEESYPDLLALLIA ::::: :.:::.. : : :. :: : .. :.... . .: : .: :::..:. . CCDS55 WNLILSYVIGTSSVARAWSGTFDELLSKQIGQFLR-TYFRMNYTGLAE--YPDFFAVCLI 160 170 180 190 200 210 200 210 220 230 240 pF1KE1 VIVTIIVALGVKNSIGFNNVLNVLNLAVWVFIMIAGLFFINGKYW--------------- .... ....:::.: :.:....:. : .:.:.::. : : CCDS55 LLLAGLLSFGVKESAWVNKVFTAVNILVLLFVMVAGFVKGNVANWKISEEFLKNISASAR 220 230 240 250 260 270 250 260 270 280 290 pF1KE1 -----------AEGQFLPHGWSGVLQGAATCFYAFIGFDIIATTGEEAKNPNTSIPYAIT . : :.:.:..:.: :::::::::.::: :::::::..::. .:: .:. CCDS55 EPPSENGTSIYGAGGFMPYGFTGTLAGAATCFYAFVGFDCIATTGEEVRNPQKAIPIGIV 280 290 300 310 320 330 300 310 320 330 340 350 pF1KE1 ASLVICLTAYVSVSVILTLMVPYYTIDTESPLMEMFVAHGFYAAKFVVAIGSVAGLTVSL .::..:. :: .::. ::::.::: .: .::: : :. ::.::: ::. .:..:: CCDS55 TSLLVCFMAYFGVSAALTLMMPYYLLDEKSPLPVAFEYVGWGPAKYVVAAGSLCALSTSL 340 350 360 370 380 390 360 370 380 390 400 410 pF1KE1 LGSLFPMPRVIYAMAGDGLLFRFLAHVSSYTETPVVACIVSGFLAALLALLVSLRDLIEM :::.::::::::::: :::::. ::...: :.::..: . :: .:::.:.: .:. :..: CCDS55 LGSIFPMPRVIYAMAEDGLLFKCLAQINSKTKTPIIATLSSGAVAALMAFLFDLKALVDM 400 410 420 430 440 450 420 430 440 450 460 470 pF1KE1 MSIGTLLAYTLVSVCVLLLRYQPESDIDGFVKFLSEEHTKKKEGILADCEKEACSPVSEG ::::::.::.::..:::.::::: :. : : ::: ..: CCDS55 MSIGTLMAYSLVAACVLILRYQP--------------------GLSYDQPK--CSPEKDG 460 470 480 490 480 490 500 510 520 530 pF1KE1 DEFSGPATNTCGAKNLPSLGDNEMLIGKSDKSTYNVNHPNYGTVDMTTGIEADESENIYL ::.. . .:: ::. .: CCDS55 ------------------LGSSPRVTSKS------------------------ESQVTML 500 540 550 560 570 580 590 pF1KE1 IKLKKLIGPHYYTMRIRLGLPGKMDRPTAATGHTVTICVLLLFILMFIFCSFIIFGSDYI . . ..:: : :. . :: .. :.. : .: .:.. . . .: : CCDS55 QR-------QGFSMRT-LFCPSLL--PTQQSASLVSFLVGFLAFLVLGLSVLTTYGVHAI 510 520 530 540 550 600 610 620 630 640 650 pF1KE1 SEQSWWAILLVVLMVLLISTLVFVILQQPENPKKLPYMAPCLPFVPAFAMLVNIYLMLKL .. :.. :..:...:. ..:..: .::.: .:. .:.: :::.:::..:::::::..: CCDS55 TRLEAWSLALLALFLVLFVAIVLTIWRQPQNQQKVAFMVPFLPFLPAFSILVNIYLMVQL 560 570 580 590 600 610 660 670 680 690 700 710 pF1KE1 STITWIRFAVWCFVGLLIYFGYGIWNSTLEISAREEALHQSTYQRYDVDDPFSVEEGFSY :. ::.::..: .:.::::.::: .: :: :.: ....: CCDS55 SADTWVRFSIWMAIGFLIYFSYGIRHS-LEGHLRDENNEEDAYPDNVHAAAEEKSAIQAN 620 630 640 650 660 670 720 730 740 750 760 770 pF1KE1 ATEGESQEDWGGPTEDKGFYYQQMSDAKANGRTSSKAKSKSKHKQNSEALIANDELDYSP CCDS55 DHHPRNLSSPFIFHEKTSEF 680 690 >>CCDS6002.2 SLC7A2 gene_id:6542|Hs108|chr8 (697 aa) initn: 1383 init1: 558 opt: 757 Z-score: 883.6 bits: 174.1 E(32554): 6.7e-43 Smith-Waterman score: 1525; 41.0% identity (67.3% similar) in 673 aa overlap (47-693:68-660) 20 30 40 50 60 70 pF1KE1 AAWYAMHSRILRTKPVESMLEGTGTTTAHGTKLAQVLTTVDLISLGVGSCVGTGMYVVSG ::: . :.:.:::.::::: .:.:.::..: CCDS60 DVRMIPCRAALTFARCLIRRKIVTLDSLEDTKLCRCLSTMDLIALGVGSTLGAGVYVLAG 40 50 60 70 80 90 80 90 100 110 120 130 pF1KE1 LVAKEMAGPGVIVSFIIAAVASILSGVCYAEFGVRVPKTTGSAYTYSYVTVGEFVAFFIG ::: .::...:::.:::.::...:.::::::.::::: :::: :.::::::. ::. : CCDS60 EVAKADSGPSIVVSFLIAALASVMAGLCYAEFGARVPKT-GSAYLYTYVTVGELWAFITG 100 110 120 130 140 150 140 150 160 170 180 190 pF1KE1 WNLILEYLIGTAAGASALSSMFDSLANHTISRWMADSVGTLNGLGKGEESYPDLLALLIA ::::: :.:::.. : : :. :: : .. :.... . .: : .: :::..:. . CCDS60 WNLILSYVIGTSSVARAWSGTFDELLSKQIGQFLR-TYFRMNYTGLAE--YPDFFAVCLI 160 170 180 190 200 210 200 210 220 230 240 pF1KE1 VIVTIIVALGVKNSIGFNNVLNVLNLAVWVFIMIAGLFFINGKYW--------------- .... ....:::.: :.:....:. : .:.:.::. : : CCDS60 LLLAGLLSFGVKESAWVNKVFTAVNILVLLFVMVAGFVKGNVANWKISEEFLKNISASAR 220 230 240 250 260 270 250 260 270 280 290 pF1KE1 -----------AEGQFLPHGWSGVLQGAATCFYAFIGFDIIATTGEEAKNPNTSIPYAIT . : :.:.:..:.: :::::::::.::: :::::::..::. .:: .:. CCDS60 EPPSENGTSIYGAGGFMPYGFTGTLAGAATCFYAFVGFDCIATTGEEVRNPQKAIPIGIV 280 290 300 310 320 330 300 310 320 330 340 350 pF1KE1 ASLVICLTAYVSVSVILTLMVPYYTIDTESPLMEMFVAHGFYAAKFVVAIGSVAGLTVSL .::..:. :: .::. ::::.::: .: .::: : :. ::.::: ::. .:..:: CCDS60 TSLLVCFMAYFGVSAALTLMMPYYLLDEKSPLPVAFEYVGWGPAKYVVAAGSLCALSTSL 340 350 360 370 380 390 360 370 380 390 400 410 pF1KE1 LGSLFPMPRVIYAMAGDGLLFRFLAHVSSYTETPVVACIVSGFLAALLALLVSLRDLIEM :::.::.::...::: :::::::::.::. ..::.: ...: ..::.:.: .:. :..: CCDS60 LGSMFPLPRILFAMARDGLLFRFLARVSKR-QSPVAATLTAGVISALMAFLFDLKALVDM 400 410 420 430 440 450 420 430 440 450 460 470 pF1KE1 MSIGTLLAYTLVSVCVLLLRYQPESDIDGFVKFLSEEHTKKKEGILADCEKEACSPVSEG ::::::.::.::..:::.::::: :. : : ::: ..: CCDS60 MSIGTLMAYSLVAACVLILRYQP--------------------GLSYDQPK--CSPEKDG 460 470 480 490 480 490 500 510 520 530 pF1KE1 DEFSGPATNTCGAKNLPSLGDNEMLIGKSDKSTYNVNHPNYGTVDMTTGIEADESENIYL ::.. . .:: ::. .: CCDS60 ------------------LGSSPRVTSKS------------------------ESQVTML 500 540 550 560 570 580 590 pF1KE1 IKLKKLIGPHYYTMRIRLGLPGKMDRPTAATGHTVTICVLLLFILMFIFCSFIIFGSDYI . . ..:: : :. . :: .. :.. : .: .:.. . . .: : CCDS60 QR-------QGFSMRT-LFCPSLL--PTQQSASLVSFLVGFLAFLVLGLSVLTTYGVHAI 510 520 530 540 550 600 610 620 630 640 650 pF1KE1 SEQSWWAILLVVLMVLLISTLVFVILQQPENPKKLPYMAPCLPFVPAFAMLVNIYLMLKL .. :.. :..:...:. ..:..: .::.: .:. .:.: :::.:::..:::::::..: CCDS60 TRLEAWSLALLALFLVLFVAIVLTIWRQPQNQQKVAFMVPFLPFLPAFSILVNIYLMVQL 560 570 580 590 600 610 660 670 680 690 700 710 pF1KE1 STITWIRFAVWCFVGLLIYFGYGIWNSTLEISAREEALHQSTYQRYDVDDPFSVEEGFSY :. ::.::..: .:.::::.::: .: :: :.: ....: CCDS60 SADTWVRFSIWMAIGFLIYFSYGIRHS-LEGHLRDENNEEDAYPDNVHAAAEEKSAIQAN 620 630 640 650 660 670 720 730 740 750 760 770 pF1KE1 ATEGESQEDWGGPTEDKGFYYQQMSDAKANGRTSSKAKSKSKHKQNSEALIANDELDYSP CCDS60 DHHPRNLSSPFIFHEKTSEF 680 690 >>CCDS9590.1 SLC7A8 gene_id:23428|Hs108|chr14 (535 aa) initn: 180 init1: 121 opt: 287 Z-score: 334.9 bits: 72.2 E(32554): 2.5e-12 Smith-Waterman score: 287; 23.1% identity (56.3% similar) in 412 aa overlap (46-442:33-421) 20 30 40 50 60 70 pF1KE1 GAAWYAMHSRILRTKPVESMLEGTGTTTAHGTKLAQVLTTVDLISLGVGSCVGTGMYVVS :. : . . :. .. ::. .:.:..: CCDS95 EGARHRNNTEKKHPGGGESDASPEAGSGGGGVALKKEIGLVSACGIIVGNIIGSGIFVSP 10 20 30 40 50 60 80 90 100 110 120 130 pF1KE1 GLVAKEMAGPGV-IVSFIIAAVASILSGVCYAEFGVRVPKTTGSAYTYSYVTVGEFVAFF : .. .. :. .. .:... ......::::.:: .::. :. :.: : ...:. CCDS95 KGVLENAGSVGLALIVWIVTGFITVVGALCYAELGVTIPKS-GGDYSYVKDIFGGLAGFL 70 80 90 100 110 120 140 150 160 170 180 190 pF1KE1 IGWNLILEYLIGTAAGASALSSMFDSLANHTISRWMADSVGTLNGLGKGEESYPDLLALL : .: . : .. ::. ..:.... . .:: ::: . CCDS95 RLWIAVL-VIYPTNQAVIALT-----FSNYVLQPLFPTCFPPESGL--------RLLAAI 130 140 150 160 200 210 220 230 240 250 pF1KE1 IAVIVTIIVALGVKNSIGFNNVLNVLNLAVWVFIMIAGLFFI-NGKY-WAEGQFLPHGWS ...: . .:. . ...... .: . ..:.: :. : .:.: : : . .... CCDS95 CLLLLTWVNCSSVRWATRVQDIFTAGKLLALALIIIMGIVQICKGEYFWLEPKNAFENFQ 170 180 190 200 210 220 260 270 280 290 300 pF1KE1 GVLQG-AATCF----YAFIGFDIIATTGEEAKNPNTSIPYAITASLVICLTAYVSVSVI- : .: : .:. :.... . :: .: ..: :: :. . .:: ..: CCDS95 EPDIGLVALAFLQGSFAYGGWNFLNYVTEELVDPYKNLPRAIFISIPLVTFVYVFANVAY 230 240 250 260 270 280 310 320 330 340 350 360 pF1KE1 LTLMVPYYTIDTES---PLMEMFVAHGFYAAKFVVAIGSVAGLTVSLLGSLFPMPRVIYA .: : : . ... . : ... . . ::... .:.. :::: :...: CCDS95 VTAMSPQELLASNAVAVTFGEKLLGVMAWIMPISVALSTFGGVN----GSLFTSSRLFFA 290 300 310 320 330 340 370 380 390 400 410 420 pF1KE1 MAGDGLLFRFLAHVSSYTETPVVACIVSGFLAALLALLVSLRDLIEMMSIGTLLAYTLVS : .: : :: . ::. : . . ...:: :..: :. ... .. : . . CCDS95 GAREGHLPSVLAMIHVKRCTPIPALLFT-CISTLLMLVTS--DMYTLINYVGFINYLFYG 350 360 370 380 390 400 430 440 450 460 470 480 pF1KE1 VCV---LLLRYQPESDIDGFVKFLSEEHTKKKEGILADCEKEACSPVSEGDEFSGPATNT : : ..::.. . :: .: CCDS95 VTVAGQIVLRWK-KPDIPRPIKINLLFPIIYLLFWAFLLVFSLWSEPVVCGIGLAIMLTG 410 420 430 440 450 771 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 19:29:36 2016 done: Sat Nov 5 19:29:37 2016 Total Scan time: 3.290 Total Display time: 0.150 Function used was FASTA [36.3.4 Apr, 2011]