FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5144, 730 aa 1>>>pF1KB5144 730 - 730 aa - 730 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6694+/-0.00112; mu= 17.9618+/- 0.067 mean_var=67.6324+/-13.650, 0's: 0 Z-trim(102.5): 34 B-trim: 11 in 1/46 Lambda= 0.155954 statistics sampled from 6926 (6959) to 6926 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.562), E-opt: 0.2 (0.214), width: 16 Scan time: 2.920 The best scores are: opt bits E(32554) CCDS9026.1 SLC6A15 gene_id:55117|Hs108|chr12 ( 730) 4873 1106.0 0 CCDS53816.1 SLC6A15 gene_id:55117|Hs108|chr12 ( 623) 4167 947.2 0 CCDS30799.1 SLC6A17 gene_id:388662|Hs108|chr1 ( 727) 3376 769.2 0 CCDS9027.1 SLC6A15 gene_id:55117|Hs108|chr12 ( 289) 1735 399.8 3e-111 CCDS43077.1 SLC6A20 gene_id:54716|Hs108|chr3 ( 592) 1593 368.0 2.3e-101 CCDS42590.1 SLC6A16 gene_id:28968|Hs108|chr19 ( 736) 1549 358.1 2.7e-98 CCDS34130.1 SLC6A19 gene_id:340024|Hs108|chr5 ( 634) 1498 346.6 6.7e-95 CCDS3860.1 SLC6A18 gene_id:348932|Hs108|chr5 ( 628) 1481 342.8 9.4e-94 CCDS2603.1 SLC6A1 gene_id:6529|Hs108|chr3 ( 599) 912 214.8 3.1e-55 CCDS2730.1 SLC6A20 gene_id:54716|Hs108|chr3 ( 555) 828 195.9 1.4e-49 CCDS48190.1 SLC6A8 gene_id:6535|Hs108|chrX ( 520) 519 126.3 1.1e-28 CCDS14726.1 SLC6A8 gene_id:6535|Hs108|chrX ( 635) 519 126.4 1.4e-28 CCDS46765.1 SLC6A6 gene_id:6533|Hs108|chr3 ( 200) 508 123.7 2.7e-28 CCDS30695.1 SLC6A9 gene_id:6536|Hs108|chr1 ( 633) 512 124.8 4.1e-28 CCDS41316.1 SLC6A9 gene_id:6536|Hs108|chr1 ( 652) 512 124.8 4.2e-28 CCDS41317.1 SLC6A9 gene_id:6536|Hs108|chr1 ( 706) 512 124.8 4.5e-28 CCDS11256.1 SLC6A4 gene_id:6532|Hs108|chr17 ( 630) 511 124.6 4.7e-28 CCDS33705.1 SLC6A6 gene_id:6533|Hs108|chr3 ( 620) 508 123.9 7.4e-28 CCDS77704.1 SLC6A6 gene_id:6533|Hs108|chr3 ( 721) 508 123.9 8.5e-28 CCDS7854.1 SLC6A5 gene_id:9152|Hs108|chr11 ( 797) 501 122.4 2.8e-27 CCDS4305.1 SLC6A7 gene_id:6534|Hs108|chr5 ( 636) 494 120.8 6.7e-27 CCDS14570.1 SLC6A14 gene_id:11254|Hs108|chrX ( 642) 490 119.9 1.3e-26 CCDS8501.1 SLC6A12 gene_id:6539|Hs108|chr12 ( 614) 482 118.0 4.2e-26 CCDS8502.1 SLC6A13 gene_id:6540|Hs108|chr12 ( 602) 480 117.6 5.7e-26 CCDS53729.1 SLC6A13 gene_id:6540|Hs108|chr12 ( 510) 479 117.3 5.8e-26 CCDS82734.1 SLC6A11 gene_id:6538|Hs108|chr3 ( 208) 466 114.3 2e-25 CCDS2602.1 SLC6A11 gene_id:6538|Hs108|chr3 ( 632) 466 114.5 5.3e-25 CCDS3863.1 SLC6A3 gene_id:6531|Hs108|chr5 ( 620) 432 106.8 1e-22 CCDS58463.1 SLC6A2 gene_id:6530|Hs108|chr16 ( 512) 410 101.8 2.7e-21 CCDS10754.1 SLC6A2 gene_id:6530|Hs108|chr16 ( 617) 410 101.9 3.2e-21 CCDS54011.1 SLC6A2 gene_id:6530|Hs108|chr16 ( 628) 410 101.9 3.3e-21 >>CCDS9026.1 SLC6A15 gene_id:55117|Hs108|chr12 (730 aa) initn: 4873 init1: 4873 opt: 4873 Z-score: 5920.2 bits: 1106.0 E(32554): 0 Smith-Waterman score: 4873; 100.0% identity (100.0% similar) in 730 aa overlap (1-730:1-730) 10 20 30 40 50 60 pF1KB5 MPKNSKVVKRELDDDVTESVKDLLSNEDAADDAFKTSELIVDGQEEKDTDVEEGSEVEDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 MPKNSKVVKRELDDDVTESVKDLLSNEDAADDAFKTSELIVDGQEEKDTDVEEGSEVEDE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 RPAWNSKLQYILAQVGFSVGLGNVWRFPYLCQKNGGGAYLLPYLILLMVIGIPLFFLELS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 RPAWNSKLQYILAQVGFSVGLGNVWRFPYLCQKNGGGAYLLPYLILLMVIGIPLFFLELS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 VGQRIRRGSIGVWNYISPKLGGIGFASCVVCYFVALYYNVIIGWSLFYFSQSFQQPLPWD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 VGQRIRRGSIGVWNYISPKLGGIGFASCVVCYFVALYYNVIIGWSLFYFSQSFQQPLPWD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 QCPLVKNASHTFVEPECEQSSATTYYWYREALNISSSISESGGLNWKMTICLLAAWVMVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 QCPLVKNASHTFVEPECEQSSATTYYWYREALNISSSISESGGLNWKMTICLLAAWVMVC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 LAMIKGIQSSGKIIYFSSLFPYVVLICFLIRAFLLNGSIDGIRHMFTPKLEIMLEPKVWR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 LAMIKGIQSSGKIIYFSSLFPYVVLICFLIRAFLLNGSIDGIRHMFTPKLEIMLEPKVWR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 EAATQVFFALGLGFGGVIAFSSYNKRDNNCHFDAVLVSFINFFTSVLATLVVFAVLGFKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 EAATQVFFALGLGFGGVIAFSSYNKRDNNCHFDAVLVSFINFFTSVLATLVVFAVLGFKA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 NVINEKCITQNSETIMKFLKMGNISQDIIPHHINLSTVTAEDYHLVYDIIQKVKEEEFPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 NVINEKCITQNSETIMKFLKMGNISQDIIPHHINLSTVTAEDYHLVYDIIQKVKEEEFPA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 LHLNSCKIEEELNKAVQGTGLAFIAFTEAMTHFPASPFWSVMFFLMLVNLGLGSMFGTIE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 LHLNSCKIEEELNKAVQGTGLAFIAFTEAMTHFPASPFWSVMFFLMLVNLGLGSMFGTIE 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB5 GIVTPIVDTFKVRKEILTVICCLLAFCIGLIFVQRSGNYFVTMFDDYSATLPLLIVVILE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 GIVTPIVDTFKVRKEILTVICCLLAFCIGLIFVQRSGNYFVTMFDDYSATLPLLIVVILE 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB5 NIAVCFVYGIDKFMEDLKDMLGFAPSRYYYYMWKYISPLMLLSLLIASVVNMGLSPPGYN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 NIAVCFVYGIDKFMEDLKDMLGFAPSRYYYYMWKYISPLMLLSLLIASVVNMGLSPPGYN 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB5 AWIEDKASEEFLSYPTWGLVVCVSLVVFAILPVPVVFIVRRFNLIDDSSGNLASVTYKRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 AWIEDKASEEFLSYPTWGLVVCVSLVVFAILPVPVVFIVRRFNLIDDSSGNLASVTYKRG 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB5 RVLKEPVNLEGDDTSLIHGKIPSEMPSPNFGKNIYRKQSGSPTLDTAPNGRYGIGYLMAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 RVLKEPVNLEGDDTSLIHGKIPSEMPSPNFGKNIYRKQSGSPTLDTAPNGRYGIGYLMAD 670 680 690 700 710 720 730 pF1KB5 IMPDMPESDL :::::::::: CCDS90 IMPDMPESDL 730 >>CCDS53816.1 SLC6A15 gene_id:55117|Hs108|chr12 (623 aa) initn: 4167 init1: 4167 opt: 4167 Z-score: 5062.8 bits: 947.2 E(32554): 0 Smith-Waterman score: 4167; 100.0% identity (100.0% similar) in 623 aa overlap (108-730:1-623) 80 90 100 110 120 130 pF1KB5 SVGLGNVWRFPYLCQKNGGGAYLLPYLILLMVIGIPLFFLELSVGQRIRRGSIGVWNYIS :::::::::::::::::::::::::::::: CCDS53 MVIGIPLFFLELSVGQRIRRGSIGVWNYIS 10 20 30 140 150 160 170 180 190 pF1KB5 PKLGGIGFASCVVCYFVALYYNVIIGWSLFYFSQSFQQPLPWDQCPLVKNASHTFVEPEC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 PKLGGIGFASCVVCYFVALYYNVIIGWSLFYFSQSFQQPLPWDQCPLVKNASHTFVEPEC 40 50 60 70 80 90 200 210 220 230 240 250 pF1KB5 EQSSATTYYWYREALNISSSISESGGLNWKMTICLLAAWVMVCLAMIKGIQSSGKIIYFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 EQSSATTYYWYREALNISSSISESGGLNWKMTICLLAAWVMVCLAMIKGIQSSGKIIYFS 100 110 120 130 140 150 260 270 280 290 300 310 pF1KB5 SLFPYVVLICFLIRAFLLNGSIDGIRHMFTPKLEIMLEPKVWREAATQVFFALGLGFGGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 SLFPYVVLICFLIRAFLLNGSIDGIRHMFTPKLEIMLEPKVWREAATQVFFALGLGFGGV 160 170 180 190 200 210 320 330 340 350 360 370 pF1KB5 IAFSSYNKRDNNCHFDAVLVSFINFFTSVLATLVVFAVLGFKANVINEKCITQNSETIMK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 IAFSSYNKRDNNCHFDAVLVSFINFFTSVLATLVVFAVLGFKANVINEKCITQNSETIMK 220 230 240 250 260 270 380 390 400 410 420 430 pF1KB5 FLKMGNISQDIIPHHINLSTVTAEDYHLVYDIIQKVKEEEFPALHLNSCKIEEELNKAVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 FLKMGNISQDIIPHHINLSTVTAEDYHLVYDIIQKVKEEEFPALHLNSCKIEEELNKAVQ 280 290 300 310 320 330 440 450 460 470 480 490 pF1KB5 GTGLAFIAFTEAMTHFPASPFWSVMFFLMLVNLGLGSMFGTIEGIVTPIVDTFKVRKEIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 GTGLAFIAFTEAMTHFPASPFWSVMFFLMLVNLGLGSMFGTIEGIVTPIVDTFKVRKEIL 340 350 360 370 380 390 500 510 520 530 540 550 pF1KB5 TVICCLLAFCIGLIFVQRSGNYFVTMFDDYSATLPLLIVVILENIAVCFVYGIDKFMEDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 TVICCLLAFCIGLIFVQRSGNYFVTMFDDYSATLPLLIVVILENIAVCFVYGIDKFMEDL 400 410 420 430 440 450 560 570 580 590 600 610 pF1KB5 KDMLGFAPSRYYYYMWKYISPLMLLSLLIASVVNMGLSPPGYNAWIEDKASEEFLSYPTW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KDMLGFAPSRYYYYMWKYISPLMLLSLLIASVVNMGLSPPGYNAWIEDKASEEFLSYPTW 460 470 480 490 500 510 620 630 640 650 660 670 pF1KB5 GLVVCVSLVVFAILPVPVVFIVRRFNLIDDSSGNLASVTYKRGRVLKEPVNLEGDDTSLI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 GLVVCVSLVVFAILPVPVVFIVRRFNLIDDSSGNLASVTYKRGRVLKEPVNLEGDDTSLI 520 530 540 550 560 570 680 690 700 710 720 730 pF1KB5 HGKIPSEMPSPNFGKNIYRKQSGSPTLDTAPNGRYGIGYLMADIMPDMPESDL ::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 HGKIPSEMPSPNFGKNIYRKQSGSPTLDTAPNGRYGIGYLMADIMPDMPESDL 580 590 600 610 620 >>CCDS30799.1 SLC6A17 gene_id:388662|Hs108|chr1 (727 aa) initn: 3274 init1: 3125 opt: 3376 Z-score: 4099.9 bits: 769.2 E(32554): 0 Smith-Waterman score: 3376; 66.3% identity (87.8% similar) in 735 aa overlap (1-730:1-727) 10 20 30 40 50 pF1KB5 MPKNSKVVKRELDDD-VTESVKDLLSNEDAADDAFKTSELIVDGQEE-KDTDVEEGSEVE :::::::..:: ... ::::: :::. :. .: .: : : : :. :. ::: ..: CCDS30 MPKNSKVTQREHSSEHVTESVADLLALEEPVD--YKQSVLNVAGEAGGKQKAVEEELDAE 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 DERPAWNSKLQYILAQVGFSVGLGNVWRFPYLCQKNGGGAYLLPYLILLMVIGIPLFFLE : ::::::::::::::.::::::::.::::::::::::::::.:::.::..::::::::: CCDS30 D-RPAWNSKLQYILAQIGFSVGLGNIWRFPYLCQKNGGGAYLVPYLVLLIIIGIPLFFLE 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 LSVGQRIRRGSIGVWNYISPKLGGIGFASCVVCYFVALYYNVIIGWSLFYFSQSFQQPLP :.:::::::::::::.:: :.::::::.::.:: ::.::::::::::.::: .::: ::: CCDS30 LAVGQRIRRGSIGVWHYICPRLGGIGFSSCIVCLFVGLYYNVIIGWSIFYFFKSFQYPLP 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 WDQCPLVKNASHTFVEPECEQSSATTYYWYREALNISSSISESGGLNWKMTICLLAAWVM :..::.:.:.: . :: :::.::::::.::::::.::.:::::::::::::.:::.:: . CCDS30 WSECPVVRNGSVAVVEAECEKSSATTYFWYREALDISDSISESGGLNWKMTLCLLVAWSI 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB5 VCLAMIKGIQSSGKIIYFSSLFPYVVLICFLIRAFLLNGSIDGIRHMFTPKLEIMLEPKV : .:..::::::::..::::::::::: :::.:..:: :..::: :::::::. ::.:.: CCDS30 VGMAVVKGIQSSGKVMYFSSLFPYVVLACFLVRGLLLRGAVDGILHMFTPKLDKMLDPQV 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB5 WREAATQVFFALGLGFGGVIAFSSYNKRDNNCHFDAVLVSFINFFTSVLATLVVFAVLGF :::::::::::::::::::::::::::.::::::::.::::::::::::::::::::::: CCDS30 WREAATQVFFALGLGFGGVIAFSSYNKQDNNCHFDAALVSFINFFTSVLATLVVFAVLGF 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB5 KANVINEKCITQNSETIMKFLKMGNISQDIIPHHINLSTVTAEDYHLVYDIIQKVKEEEF :::..::::...:.: :. .:. . .:.:.:: :.:.: .:..:: .:..:. :::..: CCDS30 KANIMNEKCVVENAEKILGYLNTNVLSRDLIPPHVNFSHLTTKDYMEMYNVIMTVKEDQF 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB5 PALHLNSCKIEEELNKAVQGTGLAFIAFTEAMTHFPASPFWSVMFFLMLVNLGLGSMFGT :: :. : .:.::.:.::::::::::::::::::::::::::::::::.:::::::.:: CCDS30 SALGLDPCLLEDELDKSVQGTGLAFIAFTEAMTHFPASPFWSVMFFLMLINLGLGSMIGT 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB5 IEGIVTPIVDTFKVRKEILTVICCLLAFCIGLIFVQRSGNYFVTMFDDYSATLPLLIVVI . ::.:::.::::: ::..:: ::..:: .::.:::::::::::::::::::::: ..:: CCDS30 MAGITTPIIDTFKVPKEMFTVGCCVFAFLVGLLFVQRSGNYFVTMFDDYSATLPLTLIVI 480 490 500 510 520 530 540 550 560 570 580 590 pF1KB5 LENIAVCFVYGIDKFMEDLKDMLGFAPSRYYYYMWKYISPLMLLSLLIASVVNMGLSPPG :::::: ..:: :::..: .:::: : :.:.::::..::: . : ::....:..::: CCDS30 LENIAVAWIYGTKKFMQELTEMLGFRPYRFYFYMWKFVSPLCMAVLTTASIIQLGVTPPG 540 550 560 570 580 590 600 610 620 630 640 650 pF1KB5 YNAWIEDKASEEFLSYPTWGLVVCVSLVVFAILPVPVVFIVRRFNLIDDSSGNLASVTYK :.:::...:.:..: .:.:.... ..:.: : ::.::::..:.:.:..:.:..: ::.:: CCDS30 YSAWIKEEAAERYLYFPNWAMALLITLIVVATLPIPVVFVLRHFHLLSDGSNTL-SVSYK 600 610 620 630 640 650 660 670 680 690 700 710 pF1KB5 RGRVLKEPVNLE-GDDTSLIHGKIPSEMPSPNFGKNIYRKQSGSPTLDTA--PNGRYGIG .::..:. ::: .:.: .: .:.::: ::: . : ... :.:. :::::: : CCDS30 KGRMMKDISNLEENDETRFILSKVPSEAPSPMPTHRSYLGPGSTSPLETSGNPNGRYGSG 660 670 680 690 700 710 720 730 pF1KB5 YLMADIMPDMPESDL ::.:. :::.: CCDS30 YLLAS----TPESEL 720 >>CCDS9027.1 SLC6A15 gene_id:55117|Hs108|chr12 (289 aa) initn: 1716 init1: 1716 opt: 1735 Z-score: 2110.8 bits: 399.8 E(32554): 3e-111 Smith-Waterman score: 1735; 92.9% identity (96.8% similar) in 280 aa overlap (1-279:1-276) 10 20 30 40 50 60 pF1KB5 MPKNSKVVKRELDDDVTESVKDLLSNEDAADDAFKTSELIVDGQEEKDTDVEEGSEVEDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 MPKNSKVVKRELDDDVTESVKDLLSNEDAADDAFKTSELIVDGQEEKDTDVEEGSEVEDE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 RPAWNSKLQYILAQVGFSVGLGNVWRFPYLCQKNGGGAYLLPYLILLMVIGIPLFFLELS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 RPAWNSKLQYILAQVGFSVGLGNVWRFPYLCQKNGGGAYLLPYLILLMVIGIPLFFLELS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 VGQRIRRGSIGVWNYISPKLGGIGFASCVVCYFVALYYNVIIGWSLFYFSQSFQQPLPWD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 VGQRIRRGSIGVWNYISPKLGGIGFASCVVCYFVALYYNVIIGWSLFYFSQSFQQPLPWD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 QCPLVKNASHTFVEPECEQSSATTYYWYREALNISSSISESGGLNWKMTICLLAAWVMVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 QCPLVKNASHTFVEPECEQSSATTYYWYREALNISSSISESGGLNWKMTICLLAAWVMVC 190 200 210 220 230 240 250 260 270 280 290 pF1KB5 LAMIKGIQSSGKIIYFSSLFPYVVLICFLIRAFL-LNGSIDGIRHMFTPKLEIMLEPKVW ::::::::::::. : : :...:. . : .:. :..:. CCDS90 LAMIKGIQSSGKV---SMLEPFLILL-ITISGFIPLSNSVTDFCGQITHNTSF 250 260 270 280 300 310 320 330 340 350 pF1KB5 REAATQVFFALGLGFGGVIAFSSYNKRDNNCHFDAVLVSFINFFTSVLATLVVFAVLGFK >>CCDS43077.1 SLC6A20 gene_id:54716|Hs108|chr3 (592 aa) initn: 1267 init1: 695 opt: 1593 Z-score: 1933.2 bits: 368.0 E(32554): 2.3e-101 Smith-Waterman score: 1825; 44.7% identity (76.6% similar) in 599 aa overlap (57-646:1-587) 30 40 50 60 70 80 pF1KB5 EDAADDAFKTSELIVDGQEEKDTDVEEGSEVEDERPAWNSKLQYILAQVGFSVGLGNVWR .: :: : ..::...: ....:::::::: CCDS43 MEKARPLWANSLQFVFACISYAVGLGNVWR 10 20 30 90 100 110 120 130 140 pF1KB5 FPYLCQKNGGGAYLLPYLILLMVIGIPLFFLELSVGQRIRRGSIGVWNYISPKLGGIGFA :::::: :::..:.::.:.:.: :.::..:::.::::.:.::::.: ::: :.:.: : CCDS43 FPYLCQMYGGGSFLVPYIIMLIVEGMPLLYLELAVGQRMRQGSIGAWRTISPYLSGVGVA 40 50 60 70 80 90 150 160 170 180 190 200 pF1KB5 SCVVCYFVALYYNVIIGWSLFYFSQSFQQPLPWDQCPLVKNASHTFVEPECEQSSATTYY : :: .:...::::: .:...:. .:::.::::. ::: :..:: . :::..:.: :. CCDS43 SVVVSFFLSMYYNVINAWAFWYLFHSFQDPLPWSVCPL--NGNHTGYDEECEKASSTQYF 100 110 120 130 140 210 220 230 240 250 260 pF1KB5 WYREALNISSSISESGGLNWKMTICLLAAWVMVCLAMIKGIQSSGKIIYFSSLFPYVVLI :::..:::: :..:.::..:. ..::: ::..: : ...: .:.::..::.. .:: ::: CCDS43 WYRKTLNISPSLQENGGVQWEPALCLLLAWLVVYLCILRGTESTGKVVYFTASLPYCVLI 150 160 170 180 190 200 270 280 290 300 310 320 pF1KB5 CFLIRAFLLNGSIDGIRHMFTPKLEIMLEPKVWREAATQVFFALGLGFGGVIAFSSYNKR .:::.. :.:. .:. .:::::.: . .::.: .::::.::.::::::..:::.:::. CCDS43 IYLIRGLTLHGATNGLMYMFTPKIEQLANPKAWINAATQIFFSLGLGFGSLIAFASYNEP 210 220 230 240 250 260 330 340 350 360 370 380 pF1KB5 DNNCHFDAVLVSFINFFTSVLATLVVFAVLGFKANVINEKCITQNSETIMKFLKMGNISQ .:::. :..::.:: :::..:..:.:.. ::::. :.:. . : : . : . CCDS43 SNNCQKHAIIVSLINSFTSIFASIVTFSIYGFKATFNYENCLKKVS------LLLTN-TF 270 280 290 300 310 320 390 400 410 420 430 440 pF1KB5 DIIPHHINLSTVTAEDYHLVYDIIQKVKEEEFPALHLNSCKIEEELNKAVQGTGLAFIAF :. .. :.. .:. .: .: :: ....:..: ::. ::::::::::.. CCDS43 DLEDGFLTASNLEQVKGYLASAYPSKYSEM-FP--QIKNCSLESELDTAVQGTGLAFIVY 330 340 350 360 370 450 460 470 480 490 500 pF1KB5 TEAMTHFPASPFWSVMFFLMLVNLGLGSMFGTIEGIVTPIVDTFKVR----KEILTVICC :::. .. .: .:::..:.::. ::.:::.:. .:.::..:. . :: .. . : CCDS43 TEAIKNMEVSQLWSVLYFFMLLMLGIGSMLGNTAAILTPLTDSKIISSHLPKEAISGLVC 380 390 400 410 420 430 510 520 530 540 550 560 pF1KB5 LLAFCIGLIFVQRSGNYFVTMFDDYSATLPLLIVVILENIAVCFVYGIDKFMEDLKDMLG :. ::..:....:::. .:.::.::: ::..:..:.::::.:::. .: ::: : : CCDS43 LVNCAIGMVFTMEAGNYWFDIFNDYAATLSLLLIVLVETIAVCYVYGLRRFESDLKAMTG 440 450 460 470 480 490 570 580 590 600 610 620 pF1KB5 FAPSRYYYYMWKYISPLMLLSLLIASVVNMGLSPP-GYNAWIEDKASEEFLSYPTWGLVV : : :. :: .:::...::.. . .. :. :.:: .... .::...:.: CCDS43 RAVSWYWKVMWAGVSPLLIVSLFVFYLSDYILTGTLKYQAWDASQGQLVTKDYPAYALAV 500 510 520 530 540 550 630 640 650 660 670 pF1KB5 CVSLVVFAILPVPVV----FIVRRFNLIDDSSGNLASVTYKRGRVLKEPVNLEGDDTSLI ::. . . .:.. :. ::.. : CCDS43 IGLLVASSTMCIPLAALGTFVQRRLKRGDADPVA 560 570 580 590 >>CCDS42590.1 SLC6A16 gene_id:28968|Hs108|chr19 (736 aa) initn: 1551 init1: 524 opt: 1549 Z-score: 1878.2 bits: 358.1 E(32554): 2.7e-98 Smith-Waterman score: 1549; 37.5% identity (71.7% similar) in 619 aa overlap (32-645:73-686) 10 20 30 40 50 60 pF1KB5 PKNSKVVKRELDDDVTESVKDLLSNEDAADDAFKTSELIVDGQEEKDTDVEEG-SEVEDE .:. .: : .:: .:. ::: CCDS42 TSWTSEAQVSAARVAEAQARTSQPKQISVLEALTASALNQKPTHEKVQMTEKKESEVLLA 50 60 70 80 90 100 70 80 90 100 110 120 pF1KB5 RPAWNSKLQYILAQVGFSVGLGNVWRFPYLCQKNGGGAYLLPYLILLMVIGIPLFFLELS :: :.:: .:::::::::. . .::: :: ..:: .. :...:...:.::.:::.. CCDS42 RPFWSSKTEYILAQVGFSMKPSCLWRFAYLWLNSGGCSFAAIYIFMLFLVGVPLLFLEMA 110 120 130 140 150 160 130 140 150 160 170 180 pF1KB5 VGQRIRRGSIGVWNYISPKLGGIGFASCVVCYFVALYYNVIIGWSLFYFSQSFQQPLPWD .:: .:.:..:::. :.: .::.:..: .::....::.::. .: .::.::::: :.::. CCDS42 AGQSMRQGGMGVWKIIAPWIGGVGYSSFMVCFILGLYFNVVNSWIIFYMSQSFQFPVPWE 170 180 190 200 210 220 190 200 210 220 230 240 pF1KB5 QCPLVKNASHTFVEPECEQSSATTYYWYREALNISSSISESGGLNWKMTICLLAAWVMVC .:::. :.: .::::... . :.::..::. :. : ..:. ..... .. : .: CCDS42 KCPLTMNSSG--FDPECERTTPSIYFWYQQALKASDRIEDGGSPVYSLVLPFFLCWCLVG 230 240 250 260 270 280 250 260 270 280 290 300 pF1KB5 LAMIKGIQSSGKIIYFSSLFPYVVLICFLIRAFLLNGSIDGIRHMFTPKLEIMLEPKVWR ::.:..:.::.:: :.: ... :.::..::.:. :.... . :. . . .:: CCDS42 AFMINGLKSTGKVIYVLVLLPCFIIVGFFIRTLLLEGAKFGLQQLVVAKISDVYNMSVWS 290 300 310 320 330 340 310 320 330 340 350 360 pF1KB5 EAATQVFFALGLGFGGVIAFSSYNKRDNNCHFDAVLVSFINFFTSVLATLVVFAVLGFKA :. ::. :.:.:.: ...:: ..::: :: ::: ::..: .. : : :::: : CCDS42 LAGGQVLSNTGIGLGSVASLASYMPQSNNCLSDAFLVSVINLLTLLVFTSFNFCVLGFWA 350 360 370 380 390 400 370 380 390 400 410 pF1KB5 NVINEKCITQNSETIMKFLKMGNISQDIIPHHINLSTVTAEDYHL-VYDIIQKVKEEEFP .::...: .:.: ..:....:.. : : .:: . :. . . :..: . CCDS42 TVITHRCCERNAEILLKLINLGKLPPDAKPP-VNLLYNPTSIYNAWLSGLPQHIKSMVL- 410 420 430 440 450 420 430 440 450 460 470 pF1KB5 ALHLNSCKIEEELNKAVQGTGLAFIAFTEAMTHFPASPFWSVMFFLMLVNLGLGSMFGTI ... :.:: .. :: .: .::..:.:::. .: : ::: .:::::. .::.: .: . CCDS42 -REVTECNIETQFLKASEGPKFAFLSFVEAMSFLPPSVFWSFIFFLMLLAMGLSSAIGIM 460 470 480 490 500 510 480 490 500 510 520 530 pF1KB5 EGIVTPIVDTFKV-RK--EILTVICCLLAFCIGLIFVQRSGNYFVTMFDDYSATLPLLIV .::.::. :::. :: ..: : :: : ::.:.. ::.::. ...:: ..:...: CCDS42 QGIITPLQDTFSFFRKHTKLLIVGVFLLMFVCGLFFTRPSGSYFIRLLSDYWIVFPIIVV 520 530 540 550 560 570 540 550 560 570 580 590 pF1KB5 VILENIAVCFVYGIDKFMEDLKDMLGFAPSRYYYYMWKYISPLMLLSLLIASVVNMGLSP :..:..:: ..:: .:. :: .:: : . ..: .. :..:: .... .:.. ..: CCDS42 VVFETMAVSWAYGARRFLADLTILLGHPISPIFGWLWPHLCPVVLLIIFVTMMVHLCMKP 580 590 600 610 620 630 600 610 620 630 640 650 pF1KB5 PGYNAWIEDKASEEFLSYPTWGLVVCVSLVVFAILPVPVVFIVRRFNLIDDSSGNLASVT : .: . ..: . :: :.:.. ..: ...:::.:. :. :.. : CCDS42 ITYMSWDSSTSKEVLRPYPPWALLLMITLFAIVILPIPAYFVYCRIHRIPFRPKSGDGPM 640 650 660 670 680 690 660 670 680 690 700 710 pF1KB5 YKRGRVLKEPVNLEGDDTSLIHGKIPSEMPSPNFGKNIYRKQSGSPTLDTAPNGRYGIGY CCDS42 TASTSLPLSHQLTPSKEVQKEEILQVDETKYPSTCNVTS 700 710 720 730 >>CCDS34130.1 SLC6A19 gene_id:340024|Hs108|chr5 (634 aa) initn: 1737 init1: 613 opt: 1498 Z-score: 1817.2 bits: 346.6 E(32554): 6.7e-95 Smith-Waterman score: 1756; 43.8% identity (73.6% similar) in 610 aa overlap (43-634:10-598) 20 30 40 50 60 pF1KB5 DDDVTESVKDLLSNEDAADDAFKTSELIVDGQEEKDTDVEEGSEVEDE----RPAWNSKL : . . .. : .:.: :: :..: CCDS34 MVRLVLPNPGLDARIPSLAELETIEQEEASSRPKWDNKA 10 20 30 70 80 90 100 110 120 pF1KB5 QYILAQVGFSVGLGNVWRFPYLCQKNGGGAYLLPYLILLMVIGIPLFFLELSVGQRIRRG ::.:. .:: ::::::::::::::..::::...:.::::.. ::::..::...:::.::: CCDS34 QYMLTCLGFCVGLGNVWRFPYLCQSHGGGAFMIPFLILLVLEGIPLLYLEFAIGQRLRRG 40 50 60 70 80 90 130 140 150 160 170 180 pF1KB5 SIGVWNYISPKLGGIGFASCVVCYFVALYYNVIIGWSLFYFSQSFQQPLPWDQCPLVKNA :.:::. : : : :.:.:: .. ..:.::::.::.: ..:. .:::.::::..::: .: CCDS34 SLGVWSSIHPALKGLGLASMLTSFMVGLYYNTIISWIMWYLFNSFQEPLPWSDCPLNENQ 100 110 120 130 140 150 190 200 210 220 230 240 pF1KB5 SHTFVEPECEQSSATTYYWYREALNISSSISESGGLNWKMTICLLAAWVMVCLAMIKGIQ . .:. :: .:: . :.::::.::::.:::.::...: : .:: :: .. . :.::. CCDS34 TG-YVD-ECARSSPVDYFWYRETLNISTSISDSGSIQWWMLLCLACAWSVLYMCTIRGIE 160 170 180 190 200 210 250 260 270 280 290 300 pF1KB5 SSGKIIYFSSLFPYVVLICFLIRAFLLNGSIDGIRHMFTPKLEIMLEPKVWREAATQVFF ..:: .:..: .::::: ::::.. :.:. .:: .:::.. . .: .: .:..:::: CCDS34 TTGKAVYITSTLPYVVLTIFLIRGLTLKGATNGIVFLFTPNVTELAQPDTWLDAGAQVFF 220 230 240 250 260 270 310 320 330 340 350 360 pF1KB5 ALGLGFGGVIAFSSYNKRDNNCHFDAVLVSFINFFTSVLATLVVFAVLGFKANVINEKCI ...:.:::.:.:::::. :::. :.:.::.:: :::: ...::..:.::.:. . :. CCDS34 SFSLAFGGLISFSSYNSVHNNCEKDSVIVSIINGFTSVYVAIVVYSVIGFRATQRYDDCF 280 290 300 310 320 330 370 380 390 400 410 420 pF1KB5 TQNSETIMK-F-LKMGNISQDIIPHHINLSTVTAEDYHLVYDIIQKVKEEE---FPALHL . : :... : : ::..: :.. :. :. . . . : . CCDS34 STNILTLINGFDLPEGNVTQ--------------ENF---VDMQQRCNASDPAAYAQLVF 340 350 360 370 380 430 440 450 460 470 480 pF1KB5 NSCKIEEELNKAVQGTGLAFIAFTEAMTHFPASPFWSVMFFLMLVNLGLGSMFGTIEGIV ..: :. :..::.:::::::.::::.:..: ::.:::.::.:: :::.::::..::.: CCDS34 QTCDINAFLSEAVEGTGLAFIVFTEAITKMPLSPLWSVLFFIMLFCLGLSSMFGNMEGVV 390 400 410 420 430 440 490 500 510 520 530 pF1KB5 TPIVDTF----KVRKEILTVICCLLAFCIGLIFVQRSGNYFVTMFDDYSATLPLLIVVIL .:. : : ::.:: . :: .: ::.::. ::.:.....:.:....::::... CCDS34 VPLQDLRVIPPKWPKEVLTGLICLGTFLIGFIFTLNSGQYWLSLLDSYAGSIPLLIIAFC 450 460 470 480 490 500 540 550 560 570 580 590 pF1KB5 ENIAVCFVYGIDKFMEDLKDMLGFAPSRYYYYMWKYISPLMLLSLLIASVVNMGLSPPGY : ..: .:::.:.: .:.. :.: :. .. :. .:::..: ... : . : CCDS34 EMFSVVYVYGVDRFNKDIEFMIGHKPNIFWQVTWRVVSPLLMLIIFLFFFVVEVSQELTY 510 520 530 540 550 560 600 610 620 630 640 650 pF1KB5 NAWIEDKASEEF-----LSYPTWGLVVCVSLVVFAILPVPVVFIVRRFNLIDDSSGNLAS . : : . ::: .:::.: :: : .. : .: CCDS34 SIW--DPGYEEFPKSQKISYPNWVYVVVVIVAGVPSLTIPGYAIYKLIRNHCQKPGDHQG 570 580 590 600 610 660 670 680 690 700 710 pF1KB5 VTYKRGRVLKEPVNLEGDDTSLIHGKIPSEMPSPNFGKNIYRKQSGSPTLDTAPNGRYGI CCDS34 LVSTLSTASMNGDLKY 620 630 >>CCDS3860.1 SLC6A18 gene_id:348932|Hs108|chr5 (628 aa) initn: 1762 init1: 651 opt: 1481 Z-score: 1796.6 bits: 342.8 E(32554): 9.4e-94 Smith-Waterman score: 1760; 43.7% identity (76.2% similar) in 584 aa overlap (59-635:16-584) 30 40 50 60 70 80 pF1KB5 AADDAFKTSELIVDGQEEKDTDVEEGSEVEDERPAWNSKLQYILAQVGFSVGLGNVWRFP :::: :..: ::.:. .::.:::::.:::: CCDS38 MAHAPEPDPAACDLGDERPKWDNKAQYLLSCTGFAVGLGNIWRFP 10 20 30 40 90 100 110 120 130 140 pF1KB5 YLCQKNGGGAYLLPYLILLMVIGIPLFFLELSVGQRIRRGSIGVWNYISPKLGGIGFASC :::: ::::.:.::.: :. :::.: .::..:::.:.::.:::. ::: :.:.:.. CCDS38 YLCQTYGGGAFLIPYVIALVFEGIPIFHVELAIGQRLRKGSVGVWTAISPYLSGVGLGCV 50 60 70 80 90 100 150 160 170 180 190 200 pF1KB5 VVCYFVALYYNVIIGWSLFYFSQSFQQPLPWDQCPLVKNASHTFVEPECEQSSATTYYWY .. ....::::.:..: :.:. .:::.::::..:: : . ::: ::. :::..:.:: CCDS38 TLSFLISLYYNTIVAWVLWYLLNSFQHPLPWSSCPPDLNRTG-FVE-ECQGSSAVSYFWY 110 120 130 140 150 160 210 220 230 240 250 260 pF1KB5 REALNISSSISESGGLNWKMTICLLAAWVMVCLAMIKGIQSSGKIIYFSSLFPYVVLICF :..:::...:..::...: . ::: :.:..: . .:.::...::.:::..::::.:: : CCDS38 RQTLNITADINDSGSIQWWLLICLAASWAVVYMCVIRGIETTGKVIYFTALFPYLVLTIF 170 180 190 200 210 220 270 280 290 300 310 320 pF1KB5 LIRAFLLNGSIDGIRHMFTPKLEIMLEPKVWREAATQVFFALGLGFGGVIAFSSYNKRDN :::.. : :. :. ..:::...:. .:.:: .::::.::.:.:.::: :::.:::. : CCDS38 LIRGLTLPGATKGLIYLFTPNMHILQNPRVWLDAATQIFFSLSLAFGGHIAFASYNSPRN 230 240 250 260 270 280 330 340 350 360 370 380 pF1KB5 NCHFDAVLVSFINFFTSVLATLVVFAVLGFKANVINEKCITQNSETIMKFLKMGNISQDI .:. :::.....: .::. :...::.::::::. :.:. .: :... :.. CCDS38 DCQKDAVVIALVNRMTSLYASIAVFSVLGFKATNDYEHCLDRN---ILSL-----INDFD 290 300 310 320 330 390 400 410 420 430 440 pF1KB5 IPHHINLSTVTAEDYHLVYDIIQKVKEEEFPALHLNSCKIEEELNKAVQGTGLAFIAFTE .:.. ... .:: : .. . .. : :..: .:. :.:...: ::::..::: CCDS38 FPEQ----SISRDDYPAVLMHLNATWPKRVAQLPLKACLLEDFLDKSASGPGLAFVVFTE 340 350 360 370 380 390 450 460 470 480 490 500 pF1KB5 AMTHFPASPFWSVMFFLMLVNLGLGSMFGTIEGIVTPIVDT----FKVRKEILTVICCLL . :.:..: :...:: :: .:::..::::.:...::..:. : :: :: . ::. CCDS38 TDLHMPGAPVWAMLFFGMLFTLGLSTMFGTVEAVITPLLDVGVLPRWVPKEALTGLVCLV 400 410 420 430 440 450 510 520 530 540 550 560 pF1KB5 AFCIGLIFVQRSGNYFVTMFDDYSATLPLLIVVILENIAVCFVYGIDKFMEDLKDMLGFA : . :. .::::.. .::...:. ::....:: ..: .:::. .: .:. : : CCDS38 CFLSATCFTLQSGNYWLEIFDNFAASPNLLMLAFLEVVGVVYVYGMKRFCDDIAWMTGRR 460 470 480 490 500 510 570 580 590 600 610 620 pF1KB5 PSRYYYYMWKYISPLMLLSLLIASVVNMGLSPPGYNAW---IEDKASEEFLSYPTWGLVV :: :. :. .::: ::....: .. . .: :.:: : :.. :: :. .. CCDS38 PSPYWRLTWRVVSPL-LLTIFVAYIILLFWKPLRYKAWNPKYELFPSRQEKLYPGWARAA 520 530 540 550 560 570 630 640 650 660 670 680 pF1KB5 CVSLVVFAILPVPVVFIVRRFNLIDDSSGNLASVTYKRGRVLKEPVNLEGDDTSLIHGKI :: : .. .: ::: CCDS38 CVLLSLLPVLWVPVAALAQLLTRRRRTWRDRDARPDTDMRPDTDTRPDTDMRPDTDMR 580 590 600 610 620 >>CCDS2603.1 SLC6A1 gene_id:6529|Hs108|chr3 (599 aa) initn: 1147 init1: 447 opt: 912 Z-score: 1105.1 bits: 214.8 E(32554): 3.1e-55 Smith-Waterman score: 1210; 31.7% identity (64.4% similar) in 618 aa overlap (30-634:9-549) 10 20 30 40 50 pF1KB5 MPKNSKVVKRELDDDVTESVKDLLSNEDAADDAFKT--SELIVDGQEEKDTDVEEGSEVE :: ..: :: : ... : :. ... CCDS26 MATNGSKVADGQISTEVSEAPVANDKPKTLVVKVQKKAA 10 20 30 60 70 80 90 100 110 pF1KB5 D--ERPAWNSKLQYILAQVGFSVGLGNVWRFPYLCQKNGGGAYLLPYLILLMVIGIPLFF : .: .:......... ::...:::::::::::: ::::::.:.::.. :. :.:::. CCDS26 DLPDRDTWKGRFDFLMSCVGYAIGLGNVWRFPYLCGKNGGGAFLIPYFLTLIFAGVPLFL 40 50 60 70 80 90 120 130 140 150 160 170 pF1KB5 LELSVGQRIRRGSIGVWNYISPKLGGIGFASCVVCYFVALYYNVIIGWSLFYFSQSFQQP :: :.:: :..:::. ..: . :.:.:. :. ... .:: :::.:...:. .:: CCDS26 LECSLGQYTSIGGLGVWK-LAPMFKGVGLAAAVLSFWLNIYYIVIISWAIYYLYNSFTTT 100 110 120 130 140 150 180 190 200 210 220 230 pF1KB5 LPWDQCPLVKNASHTFVE----PECEQSSATTYYWYREALNISSSISESGGLNWKMTICL ::: :: :... : . ...::.. .: :. ........ : . : ..: : CCDS26 LPWKQCDNPWNTDRCFSNYSMVNTTNMTSAVVEFWERNMHQMTDGLDKPGQIRWPLAITL 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB5 LAAWVMVCLAMIKGIQSSGKIIYFSSLFPYVVLICFLIRAFLLNGSIDGIRHMFTPKLEI ::..: . . ::. .::..:::. .::..:: ...:. : :. .:: ..::... CCDS26 AIAWILVYFCIWKGVGWTGKVVYFSATYPYIMLIILFFRGVTLPGAKEGILFYITPNFRK 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB5 MLEPKVWREAATQVFFALGLGFGGVIAFSSYNKRDNNCHFDAVLVSFINFFTSVLATLVV . . .:: .::::.::. :::.:..::..:::. :: . :...: :: ::..: .:. CCDS26 LSDSEVWLDAATQIFFSYGLGLGSLIALGSYNSFHNNVYRDSIIVCCINSCTSMFAGFVI 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB5 FAVLGFKANVINEKCITQNSETIMKFLKMGNISQDIIPHHINLSTVTAEDYHLVYDIIQK :...:: :.: :. : . :. CCDS26 FSIVGFMAHV------TKRS---------------------------------IADV--- 340 350 420 430 440 450 460 470 pF1KB5 VKEEEFPALHLNSCKIEEELNKAVQGTGLAFIAFTEAMTHFPASPFWSVMFFLMLVNLGL :..: ::::.:. ::.:..: ::.:...:: ::. ::. CCDS26 ----------------------AASGPGLAFLAYPEAVTQLPISPLWAILFFSMLLMLGI 360 370 380 390 480 490 500 510 520 pF1KB5 GSMFGTIEGIVTPIVDTF----KVRKEILTVICCLLAFCIGLIFVQRSGNYFVTMFDDYS :.: :.::..: .:: . . :.:.. . :.... ::: . ..: : .:: :: CCDS26 DSQFCTVEGFITALVDEYPRLLRNRRELFIAAVCIISYLIGLSNITQGGIYVFKLFDYYS 400 410 420 430 440 450 530 540 550 560 570 580 pF1KB5 AT-LPLLIVVILENIAVCFVYGIDKFMEDLKDMLGFAPSRYYYYMWKYISPLMLLSLLIA :. . ::..:..: ... . ::...:......:.: : .. :....:... ...: CCDS26 ASGMSLLFLVFFECVSISWFYGVNRFYDNIQEMVGSRPCIWWKLCWSFFTPIIVAGVFIF 460 470 480 490 500 510 590 600 610 620 630 640 pF1KB5 SVVNMGLSPPGYNAWIEDKASEEFLSYPTWGLVVCVSLVVFAILPVPVVFIVRRFNLIDD :.:.: .: .. .. .: :: : ... ... .: CCDS26 SAVQM--TPLTMGNYV----------FPKWGQGVGWLMALSSMVLIPGYMAYMFLTLKGS 520 530 540 550 560 650 660 670 680 690 700 pF1KB5 SSGNLASVTYKRGRVLKEPVNLEGDDTSLIHGKIPSEMPSPNFGKNIYRKQSGSPTLDTA CCDS26 LKQRIQVMVQPSEDIVRPENGPEQPQAGSSTSKEAYI 570 580 590 >>CCDS2730.1 SLC6A20 gene_id:54716|Hs108|chr3 (555 aa) initn: 1461 init1: 590 opt: 828 Z-score: 1003.4 bits: 195.9 E(32554): 1.4e-49 Smith-Waterman score: 1606; 41.9% identity (71.5% similar) in 599 aa overlap (57-646:1-550) 30 40 50 60 70 80 pF1KB5 EDAADDAFKTSELIVDGQEEKDTDVEEGSEVEDERPAWNSKLQYILAQVGFSVGLGNVWR .: :: : ..::...: ....:::::::: CCDS27 MEKARPLWANSLQFVFACISYAVGLGNVWR 10 20 30 90 100 110 120 130 140 pF1KB5 FPYLCQKNGGGAYLLPYLILLMVIGIPLFFLELSVGQRIRRGSIGVWNYISPKLGGIGFA :::::: :::..:.::.:.:.: :.::..:::.::::.:.::::.: ::: :.:.: : CCDS27 FPYLCQMYGGGSFLVPYIIMLIVEGMPLLYLELAVGQRMRQGSIGAWRTISPYLSGVGVA 40 50 60 70 80 90 150 160 170 180 190 200 pF1KB5 SCVVCYFVALYYNVIIGWSLFYFSQSFQQPLPWDQCPLVKNASHTFVEPECEQSSATTYY : :: .:...::::: .:...:. .:::.::::. ::: :..:: . :::..:.: :. CCDS27 SVVVSFFLSMYYNVINAWAFWYLFHSFQDPLPWSVCPL--NGNHTGYDEECEKASSTQYF 100 110 120 130 140 210 220 230 240 250 260 pF1KB5 WYREALNISSSISESGGLNWKMTICLLAAWVMVCLAMIKGIQSSGKIIYFSSLFPYVVLI :::..:::: :..:.::..:. ..::: ::..: : ...: .:.::: CCDS27 WYRKTLNISPSLQENGGVQWEPALCLLLAWLVVYLCILRGTESTGKI------------- 150 160 170 180 190 270 280 290 300 310 320 pF1KB5 CFLIRAFLLNGSIDGIRHMFTPKLEIMLEPKVWREAATQVFFALGLGFGGVIAFSSYNKR : . .::.: .::::.::.::::::..:::.:::. CCDS27 ------------------------EQLANPKAWINAATQIFFSLGLGFGSLIAFASYNEP 200 210 220 230 330 340 350 360 370 380 pF1KB5 DNNCHFDAVLVSFINFFTSVLATLVVFAVLGFKANVINEKCITQNSETIMKFLKMGNISQ .:::. :..::.:: :::..:..:.:.. ::::. :.:. . : : . : . CCDS27 SNNCQKHAIIVSLINSFTSIFASIVTFSIYGFKATFNYENCLKKVS------LLLTN-TF 240 250 260 270 280 390 400 410 420 430 440 pF1KB5 DIIPHHINLSTVTAEDYHLVYDIIQKVKEEEFPALHLNSCKIEEELNKAVQGTGLAFIAF :. .. :.. .:. .: .: :: ....:..: ::. ::::::::::.. CCDS27 DLEDGFLTASNLEQVKGYLASAYPSKYSEM-FP--QIKNCSLESELDTAVQGTGLAFIVY 290 300 310 320 330 340 450 460 470 480 490 500 pF1KB5 TEAMTHFPASPFWSVMFFLMLVNLGLGSMFGTIEGIVTPIVDTFKVR----KEILTVICC :::. .. .: .:::..:.::. ::.:::.:. .:.::..:. . :: .. . : CCDS27 TEAIKNMEVSQLWSVLYFFMLLMLGIGSMLGNTAAILTPLTDSKIISSHLPKEAISGLVC 350 360 370 380 390 400 510 520 530 540 550 560 pF1KB5 LLAFCIGLIFVQRSGNYFVTMFDDYSATLPLLIVVILENIAVCFVYGIDKFMEDLKDMLG :. ::..:....:::. .:.::.::: ::..:..:.::::.:::. .: ::: : : CCDS27 LVNCAIGMVFTMEAGNYWFDIFNDYAATLSLLLIVLVETIAVCYVYGLRRFESDLKAMTG 410 420 430 440 450 460 570 580 590 600 610 620 pF1KB5 FAPSRYYYYMWKYISPLMLLSLLIASVVNMGLSPP-GYNAWIEDKASEEFLSYPTWGLVV : : :. :: .:::...::.. . .. :. :.:: .... .::...:.: CCDS27 RAVSWYWKVMWAGVSPLLIVSLFVFYLSDYILTGTLKYQAWDASQGQLVTKDYPAYALAV 470 480 490 500 510 520 630 640 650 660 670 pF1KB5 CVSLVVFAILPVPVV----FIVRRFNLIDDSSGNLASVTYKRGRVLKEPVNLEGDDTSLI ::. . . .:.. :. ::.. : CCDS27 IGLLVASSTMCIPLAALGTFVQRRLKRGDADPVA 530 540 550 730 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 22:21:40 2016 done: Thu Nov 3 22:21:41 2016 Total Scan time: 2.920 Total Display time: 0.160 Function used was FASTA [36.3.4 Apr, 2011]