FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2555, 456 aa 1>>>pF1KE2555 456 - 456 aa - 456 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.0595+/-0.000863; mu= 13.8918+/- 0.051 mean_var=74.2683+/-14.871, 0's: 0 Z-trim(107.2): 17 B-trim: 36 in 2/48 Lambda= 0.148824 statistics sampled from 9451 (9462) to 9451 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.656), E-opt: 0.2 (0.291), width: 16 Scan time: 2.680 The best scores are: opt bits E(32554) CCDS8137.1 SLC29A2 gene_id:3177|Hs108|chr11 ( 456) 3003 654.1 8.5e-188 CCDS73326.1 SLC29A2 gene_id:3177|Hs108|chr11 ( 361) 1577 347.9 1e-95 CCDS4908.1 SLC29A1 gene_id:2030|Hs108|chr6 ( 456) 625 143.5 4.2e-34 CCDS7310.1 SLC29A3 gene_id:55315|Hs108|chr10 ( 475) 366 87.9 2.4e-17 CCDS5340.1 SLC29A4 gene_id:222962|Hs108|chr7 ( 530) 272 67.8 3.2e-11 >>CCDS8137.1 SLC29A2 gene_id:3177|Hs108|chr11 (456 aa) initn: 3003 init1: 3003 opt: 3003 Z-score: 3485.1 bits: 654.1 E(32554): 8.5e-188 Smith-Waterman score: 3003; 100.0% identity (100.0% similar) in 456 aa overlap (1-456:1-456) 10 20 30 40 50 60 pF1KE2 MARGDAPRDSYHLVGISFFILGLGTLLPWNFFITAIPYFQARLAGAGNSTARILSTNHTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 MARGDAPRDSYHLVGISFFILGLGTLLPWNFFITAIPYFQARLAGAGNSTARILSTNHTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 PEDAFNFNNWVTLLSQLPLLLFTLLNSFLYQCVPETVRILGSLLAILLLFALTAALVKVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 PEDAFNFNNWVTLLSQLPLLLFTLLNSFLYQCVPETVRILGSLLAILLLFALTAALVKVD 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 MSPGPFFSITMASVCFINSFSAVLQGSLFGQLGTMPSTYSTLFLSGQGLAGIFAALAMLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 MSPGPFFSITMASVCFINSFSAVLQGSLFGQLGTMPSTYSTLFLSGQGLAGIFAALAMLL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 SMASGVDAETSALGYFITPCVGILMSIVCYLSLPHLKFARYYLANKSSQAQAQELETKAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 SMASGVDAETSALGYFITPCVGILMSIVCYLSLPHLKFARYYLANKSSQAQAQELETKAE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 LLQSDENGIPSSPQKVALTLDLDLEKEPESEPDEPQKPGKPSVFTVFQKIWLTALCLVLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 LLQSDENGIPSSPQKVALTLDLDLEKEPESEPDEPQKPGKPSVFTVFQKIWLTALCLVLV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 FTVTLSVFPAITAMVTSSTSPGKWSQFFNPICCFLLFNIMDWLGRSLTSYFLWPDEDSRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 FTVTLSVFPAITAMVTSSTSPGKWSQFFNPICCFLLFNIMDWLGRSLTSYFLWPDEDSRL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 LPLLVCLRFLFVPLFMLCHVPQRSRLPILFPQDAYFITFMLLFAVSNGYLVSLTMCLAPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 LPLLVCLRFLFVPLFMLCHVPQRSRLPILFPQDAYFITFMLLFAVSNGYLVSLTMCLAPR 370 380 390 400 410 420 430 440 450 pF1KE2 QVLPHEREVAGALMTFFLALGLSCGASLSFLFKALL :::::::::::::::::::::::::::::::::::: CCDS81 QVLPHEREVAGALMTFFLALGLSCGASLSFLFKALL 430 440 450 >>CCDS73326.1 SLC29A2 gene_id:3177|Hs108|chr11 (361 aa) initn: 1574 init1: 1574 opt: 1577 Z-score: 1832.0 bits: 347.9 E(32554): 1e-95 Smith-Waterman score: 1577; 97.6% identity (99.2% similar) in 252 aa overlap (1-250:1-252) 10 20 30 40 50 60 pF1KE2 MARGDAPRDSYHLVGISFFILGLGTLLPWNFFITAIPYFQARLAGAGNSTARILSTNHTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 MARGDAPRDSYHLVGISFFILGLGTLLPWNFFITAIPYFQARLAGAGNSTARILSTNHTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 PEDAFNFNNWVTLLSQLPLLLFTLLNSFLYQCVPETVRILGSLLAILLLFALTAALVKVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 PEDAFNFNNWVTLLSQLPLLLFTLLNSFLYQCVPETVRILGSLLAILLLFALTAALVKVD 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 MSPGPFFSITMASVCFINSFSAVLQGSLFGQLGTMPSTYSTLFLSGQGLAGIFAALAMLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 MSPGPFFSITMASVCFINSFSAVLQGSLFGQLGTMPSTYSTLFLSGQGLAGIFAALAMLL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 SMASGVDAETSALGYFITPCVGILMSIVCYLSLPHLKFARYYLANKSSQAQAQELETKAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 SMASGVDAETSALGYFITPCVGILMSIVCYLSLPHLKFARYYLANKSSQAQAQELETKAE 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 LLQSD--ENGIPSSPQKVALTLDLDLEKEPESEPDEPQKPGKPSVFTVFQKIWLTALCLV ::::: ....: CCDS73 LLQSDLADSAVPCVGLHSHPVRLPRHHSHGDQLHQSWEVESVLQPHLLLPPLQHHGLAGT 250 260 270 280 290 300 >>CCDS4908.1 SLC29A1 gene_id:2030|Hs108|chr6 (456 aa) initn: 1238 init1: 616 opt: 625 Z-score: 725.7 bits: 143.5 E(32554): 4.2e-34 Smith-Waterman score: 1358; 47.1% identity (73.0% similar) in 471 aa overlap (1-456:1-456) 10 20 30 40 50 pF1KE2 MARGDAPRDSYHLVGISFFILGLGTLLPWNFFITAIPYFQARLAGAGNS---TARI---- :. . :.: :. : . ::.::::::::::::.:: :: :: . : ::.. CCDS49 MTTSHQPQDRYKAVWLIFFMLGLGTLLPWNFFMTATQYFTNRLDMSQNVSLVTAELSKDA 10 20 30 40 50 60 60 70 80 90 100 pF1KE2 -LSTNHTGPEDAFN-----FNNWVTLLSQLPLLLFTLLNSFLYQCVPETVRILGSLLAIL :. ..: : ::: .:: ..::::::: :::::.: .:..:::::::.::: CCDS49 QASAAPAAPLPERNSLSAIFNNVMTLCAMLPLLLFTYLNSFLHQRIPQSVRILGSLVAIL 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE2 LLFALTAALVKVDMSPGPFFSITMASVCFINSFSAVLQGSLFGQLGTMPSTYSTLFLSGQ :.: .:: ::::... ::: ::: .. .::::.:.::::::: : .:..:.. ..::: CCDS49 LVFLITAILVKVQLDALPFFVITMIKIVLINSFGAILQGSLFGLAGLLPASYTAPIMSGQ 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE2 GLAGIFAALAMLLSMASGVDAETSALGYFITPCVGILMSIVCYLSLPHLKFARYYLANKS ::::.::..::. ..::: . ::.::::: :. :...:.:::.::.:.: ::: : CCDS49 GLAGFFASVAMICAIASGSELSESAFGYFITACAVIILTIICYLGLPRLEFYRYYQQLKL 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE2 SQAQAQELETKAELLQSDENGIP-SSPQKVALTLDLDLEKEPESEPDEPQKPGKPSVFTV : ::: .:... :. : .. .. ..... ...: .: :. .. CCDS49 EGPGEQ--ETKLDLISKGEE--PRAGKEESGVSVS---NSQPTNESH--------SIKAI 250 260 270 280 290 300 310 320 330 340 pF1KE2 FQKIWLTALCLVLVFTVTLSVFPAITAMVTSSTSPGK-WSQFFNPICCFLLFNIMDWLGR ...: . :. . ..::.:...:::.:. : :: . .. : ..: :. ::: :::.::::: CCDS49 LKNISVLAFSVCFIFTITIGMFPAVTVEVKSSIAGSSTWERYFIPVSCFLTFNIFDWLGR 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE2 SLTSYFLWPDEDSRLLPLLVCLRFLFVPLFMLCHVPQRSRLPILFPQDAYFITFMLLFAV :::. :.:: .::: :: :: :..::::..::.. : : ..: .::.:: :: :: CCDS49 SLTAVFMWPGKDSRWLPSLVLARLVFVPLLLLCNIKPRRYLTVVFEHDAWFIFFMAAFAF 350 360 370 380 390 400 410 420 430 440 450 pF1KE2 SNGYLVSLTMCLAPRQVLPHEREVAGALMTFFLALGLSCGASLSFLFKALL :::::.:: ::..:..: : : :.:::.:.::: :::. :: .::::.:.. CCDS49 SNGYLASLCMCFGPKKVKPAEAETAGAIMAFFLCLGLALGAVFSFLFRAIV 410 420 430 440 450 >>CCDS7310.1 SLC29A3 gene_id:55315|Hs108|chr10 (475 aa) initn: 560 init1: 172 opt: 366 Z-score: 424.9 bits: 87.9 E(32554): 2.4e-17 Smith-Waterman score: 759; 32.3% identity (63.5% similar) in 458 aa overlap (7-456:46-475) 10 20 30 pF1KE2 MARGDAPRDSYHLVGISFFILGLGTLLPWNFFITAI :.: . . : :: ::.:.:::::::::: CCDS73 TYRTTSSSLRADQEALLEKLLDRPPPGLQRPEDRFCGTYIIFFSLGIGSLLPWNFFITAK 20 30 40 50 60 70 40 50 60 70 80 90 pF1KE2 PYFQARLAGAGNSTARILSTNHTGPEDAFN-FNNWVTLLSQLPLLLFTLLNSFLYQCVPE :.. .: ::.. . . : : .: :...... : .: .: . : .: . : CCDS73 EYWMFKLR---NSSSPATGEDPEGS-DILNYFESYLAVASTVPSMLCLVANFLLVNRVAV 80 90 100 110 120 130 100 110 120 130 140 150 pF1KE2 TVRILGSLLAILLLFALTAALVKVDMSPGP--FFSITMASVCFINSFSAVLQGSLFGQLG .:.:.:: .:: .: . .:::::: : ::..:.. . .... :.:...:..:. : CCDS73 HIRVLASLTVILAIFMVITALVKVDTSSWTRGFFAVTIVCMVILSGASTVFSSSIYGMTG 140 150 160 170 180 190 160 170 180 190 200 210 pF1KE2 TMPSTYSTLFLSGQGLAGIFAALAMLLSMASGVDAETSALGYFITPCVGILMSIVCYLSL ..: : ..:: ...: .:.: :...:.. :...:::..:.: : ... . :: : CCDS73 SFPMRNSQALISGGAMGGTVSAVASLVDLAASSDVRNSALAFFLTATVFLVLCMGLYLLL 200 210 220 230 240 250 220 230 240 250 260 270 pF1KE2 PHLKFARYYLANKSSQAQAQELETKAELLQSDENGIPSSPQKVALTLDLDLEKEPESEPD .:..::::. . : .. . : : .: . :: .. : CCDS73 SRLEYARYYM----RPVLAAHVFSGEEELPQDSLSAPSVASRFI---------------D 260 270 280 290 280 290 300 310 320 330 pF1KE2 EPQKPGKPSVFTVFQKIWLTALCLVLVFTVTLSVFPAITAMVTS--STSPGKWS-QFFNP : .: ...: ..:.. :: .: ..::: . . : . : . :. .:: : CCDS73 SHTPPLRP----ILKKTASLGFCVTYVFFITSLIYPAICTNIESLNKGSGSLWTTKFFIP 300 310 320 330 340 340 350 360 370 380 pF1KE2 ICCFLLFNIMDWLGRSLTSYFLWPDEDSRLLPLLVCLRFLFVPLFMLCHVPQRSRLP-IL . :::.:. : ::.::... : .:. :: .: :: ..:::.::. : .: .. CCDS73 LTTFLLYNFADLCGRQLTAWIQVPGPNSKALPGFVLLRTCLIPLFVLCNYQPRVHLKTVV 350 360 370 380 390 400 390 400 410 420 430 440 pF1KE2 FPQDAYFITFMLLFAVSNGYLVSLTMCLAPRQVLPHE-REVAGALMTFFLALGLSCGASL : .:.: . :...::::: .:.. .:. ..:.: :..:..:.:.. :::. :.. CCDS73 FQSDVYPALLSSLLGLSNGYLSTLALLYGPK-IVPRELAEATGVVMSFYVCLGLTLGSAC 410 420 430 440 450 460 450 pF1KE2 SFLFKALL : :. :. CCDS73 STLLVHLI 470 >>CCDS5340.1 SLC29A4 gene_id:222962|Hs108|chr7 (530 aa) initn: 349 init1: 128 opt: 272 Z-score: 315.0 bits: 67.8 E(32554): 3.2e-11 Smith-Waterman score: 447; 26.0% identity (54.3% similar) in 477 aa overlap (7-450:63-503) 10 20 30 pF1KE2 MARGDAPRDSYHLVGISFFILGLGTLLPWNFFITAI : : :: . ..... :.: :::.: ::: . CCDS53 LEEAAEAAQGQGLRARGVPAFTDTTLDEPVPDDRYHAIYFAMLLAGVGFLLPYNSFITDV 40 50 60 70 80 90 40 50 60 70 80 90 pF1KE2 PYFQARLAGAGNSTARILSTNHTGPEDAFNFNNWVTLLSQLPLLLFTLLNSFLYQCVPET :.. : : .. :. ..: : : .:::. : . . CCDS53 DYLH-----------------HKYPGTSIVFD--MSLTYILVALAAVLLNNVLVERLTLH 100 110 120 130 100 110 120 130 140 150 pF1KE2 VRIL-GSLLAILLLFALTAALVKVDM-SPGPFFSITMASVCFINSFSAVLQGSLFGQLGT .:: : :::. :. .. : ... : ..:..:.: . .: :.:..: : CCDS53 TRITAGYLLALGPLLFISICDVWLQLFSRDQAYAINLAAVGTVAFGCTVQQSSFYGYTGM 140 150 160 170 180 190 160 170 180 190 200 210 pF1KE2 MPSTYSTLFLSGQGLAGIFAALAMLLSMASGVDAETSALGYFITPCVGILMSIVCYLSLP .:. :. ..:.. ::.. .:. .:. : ..:.: .:. :.. . ..:.: CCDS53 LPKRYTQGVMTGESTAGVMISLSRILTKLLLPDERASTLIFFL---VSVALELLCFLL-- 200 210 220 230 240 220 230 240 pF1KE2 HL-----KFARYYLANKSSQAQAQ--------------------ELETKAELLQSDENGI :: .:. .: . .. ... ..: : : .:. CCDS53 HLLVRRSRFVLFYTTRPRDSHRGRPGLGRGYGYRVHHDVVAGDVHFEHPAPALAPNESPK 250 260 270 280 290 300 250 260 270 280 290 300 pF1KE2 PSSPQKVALT----LDLDLEKEPESEPDEPQ-KPGKPSVFTVFQKIWLTALCLVLVFTVT : ..:. . . .:. . :. . . : . ..: . :: : ..... .: CCDS53 DSPAHEVTGSGGAYMRFDVPR-PRVQRSWPTFRALLLHRYVVARVIWADMLSIAVTYFIT 310 320 330 340 350 360 310 320 330 340 350 360 pF1KE2 LSVFPAITAMVTSSTSPGKWSQFFNPICCFLLFNIMDWLGRSLTSYFL-WPDEDSRLLPL : .::.. . . :.: :: . .::. :..:. :.. . : . ..:: CCDS53 LCLFPGLESEIRHCIL-GEWL----PILIMAVFNLSDFVGKILAALPVDW--RGTHLLAC 370 380 390 400 410 420 370 380 390 400 410 420 pF1KE2 LVCLRFLFVPLFMLCHVPQRSRLPILFPQDAYFITFMLLFAVSNGYLVSLTMCLAPRQVL ::: .:.:::.:: : : .: : . :. : ::...::::. :. : :: .: CCDS53 -SCLRVVFIPLFILCVYP--SGMPALR-HPAWPCIFSLLMGISNGYFGSVPMILAAGKVS 430 440 450 460 470 430 440 450 pF1KE2 PHEREVAGALMTFFLALGLSCGASLSFLFKALL :..::.:: :: ::. :..... CCDS53 PKQRELAGNTMTVSYMSGLTLGSAVAYCTYSLTRDAHGSCLHASTANGSILAGL 480 490 500 510 520 530 456 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 10:49:23 2016 done: Tue Nov 8 10:49:23 2016 Total Scan time: 2.680 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]