FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1397, 678 aa 1>>>pF1KSDA1397 678 - 678 aa - 678 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.7674+/-0.000888; mu= 12.5923+/- 0.053 mean_var=95.6016+/-19.002, 0's: 0 Z-trim(107.9): 42 B-trim: 0 in 0/53 Lambda= 0.131172 statistics sampled from 9872 (9894) to 9872 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.663), E-opt: 0.2 (0.304), width: 16 Scan time: 3.870 The best scores are: opt bits E(32554) CCDS34562.1 TULP4 gene_id:56995|Hs108|chr6 ( 678) 4629 886.6 0 CCDS34561.1 TULP4 gene_id:56995|Hs108|chr6 (1543) 4575 876.5 0 CCDS1695.1 WDR35 gene_id:57539|Hs108|chr2 (1170) 395 85.5 4.8e-16 CCDS33152.1 WDR35 gene_id:57539|Hs108|chr2 (1181) 395 85.5 4.9e-16 >>CCDS34562.1 TULP4 gene_id:56995|Hs108|chr6 (678 aa) initn: 4629 init1: 4629 opt: 4629 Z-score: 4735.6 bits: 886.6 E(32554): 0 Smith-Waterman score: 4629; 100.0% identity (100.0% similar) in 678 aa overlap (1-678:1-678) 10 20 30 40 50 60 pF1KSD MYAAVEHGPVLCSDSNILCLSWKGRVPKSEKEKPVCRRRYYEEGWLATGNGRGVVGVTFT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MYAAVEHGPVLCSDSNILCLSWKGRVPKSEKEKPVCRRRYYEEGWLATGNGRGVVGVTFT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD SSHCRRDRSTPQRINFNLRGHNSEVVLVRWNEPYQKLATCDADGGIFVWIQYEGRWSVEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SSHCRRDRSTPQRINFNLRGHNSEVVLVRWNEPYQKLATCDADGGIFVWIQYEGRWSVEL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD VNDRGAQVSDFTWSHDGTQALISYRDGFVLVGSVSGQRHWSSEINLESQITCGIWTPDDQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 VNDRGAQVSDFTWSHDGTQALISYRDGFVLVGSVSGQRHWSSEINLESQITCGIWTPDDQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD QVLFGTADGQVIVMDCHGRMLAHVLLHESDGVLGMSWNYPIFLVEDSSESDTDSDDYAPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 QVLFGTADGQVIVMDCHGRMLAHVLLHESDGVLGMSWNYPIFLVEDSSESDTDSDDYAPP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD QDGPAAYPIPVQNIKPLLTVSFTSGDISLMNNYDDLSPTVIRSGLKEVVAQWCTQGDLLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 QDGPAAYPIPVQNIKPLLTVSFTSGDISLMNNYDDLSPTVIRSGLKEVVAQWCTQGDLLA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD VAGMERQTQLGELPNGPLLKSAMVKFYNVRGEHIFTLDTLVQRPIISICWGHRDSRLLMA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 VAGMERQTQLGELPNGPLLKSAMVKFYNVRGEHIFTLDTLVQRPIISICWGHRDSRLLMA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD SGPALYVVRVEHRVSSLQLLCQQAIASTLREDKDVSKLTLPPRLCSYLSTAFIPTIKPPI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SGPALYVVRVEHRVSSLQLLCQQAIASTLREDKDVSKLTLPPRLCSYLSTAFIPTIKPPI 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD PDPNNMRDFVSYPSAGNERLHCTMKRTEDDPEVGGPCYTLYLEYLGGLVPILKGRRISKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PDPNNMRDFVSYPSAGNERLHCTMKRTEDDPEVGGPCYTLYLEYLGGLVPILKGRRISKL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD RPEFVIMDPRTDSKPDEIYGNSLISTVIDSCNCSDSSDIELSDDWAAKKSPKISRASKSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 RPEFVIMDPRTDSKPDEIYGNSLISTVIDSCNCSDSSDIELSDDWAAKKSPKISRASKSP 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD KLPRISIEARKSPKLPRAAQELSRSPRLPLRKPSVGSPSLTRREFPFEDITQHNYLAQVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 KLPRISIEARKSPKLPRAAQELSRSPRLPLRKPSVGSPSLTRREFPFEDITQHNYLAQVT 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD SNIWGTKFKIVGLAAFLPTNLGAVIYKTSLLHLQPRQMTIYLPEVRKISMDYINLPVFNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SNIWGTKFKIVGLAAFLPTNLGAVIYKTSLLHLQPRQMTIYLPEVRKISMDYINLPVFNP 610 620 630 640 650 660 670 pF1KSD NVFSEDEDDLPGDAVWTD :::::::::::::::::: CCDS34 NVFSEDEDDLPGDAVWTD 670 >>CCDS34561.1 TULP4 gene_id:56995|Hs108|chr6 (1543 aa) initn: 4575 init1: 4575 opt: 4575 Z-score: 4674.7 bits: 876.5 E(32554): 0 Smith-Waterman score: 4575; 100.0% identity (100.0% similar) in 671 aa overlap (1-671:1-671) 10 20 30 40 50 60 pF1KSD MYAAVEHGPVLCSDSNILCLSWKGRVPKSEKEKPVCRRRYYEEGWLATGNGRGVVGVTFT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MYAAVEHGPVLCSDSNILCLSWKGRVPKSEKEKPVCRRRYYEEGWLATGNGRGVVGVTFT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD SSHCRRDRSTPQRINFNLRGHNSEVVLVRWNEPYQKLATCDADGGIFVWIQYEGRWSVEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SSHCRRDRSTPQRINFNLRGHNSEVVLVRWNEPYQKLATCDADGGIFVWIQYEGRWSVEL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD VNDRGAQVSDFTWSHDGTQALISYRDGFVLVGSVSGQRHWSSEINLESQITCGIWTPDDQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 VNDRGAQVSDFTWSHDGTQALISYRDGFVLVGSVSGQRHWSSEINLESQITCGIWTPDDQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD QVLFGTADGQVIVMDCHGRMLAHVLLHESDGVLGMSWNYPIFLVEDSSESDTDSDDYAPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 QVLFGTADGQVIVMDCHGRMLAHVLLHESDGVLGMSWNYPIFLVEDSSESDTDSDDYAPP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD QDGPAAYPIPVQNIKPLLTVSFTSGDISLMNNYDDLSPTVIRSGLKEVVAQWCTQGDLLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 QDGPAAYPIPVQNIKPLLTVSFTSGDISLMNNYDDLSPTVIRSGLKEVVAQWCTQGDLLA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD VAGMERQTQLGELPNGPLLKSAMVKFYNVRGEHIFTLDTLVQRPIISICWGHRDSRLLMA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 VAGMERQTQLGELPNGPLLKSAMVKFYNVRGEHIFTLDTLVQRPIISICWGHRDSRLLMA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD SGPALYVVRVEHRVSSLQLLCQQAIASTLREDKDVSKLTLPPRLCSYLSTAFIPTIKPPI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SGPALYVVRVEHRVSSLQLLCQQAIASTLREDKDVSKLTLPPRLCSYLSTAFIPTIKPPI 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD PDPNNMRDFVSYPSAGNERLHCTMKRTEDDPEVGGPCYTLYLEYLGGLVPILKGRRISKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PDPNNMRDFVSYPSAGNERLHCTMKRTEDDPEVGGPCYTLYLEYLGGLVPILKGRRISKL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD RPEFVIMDPRTDSKPDEIYGNSLISTVIDSCNCSDSSDIELSDDWAAKKSPKISRASKSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 RPEFVIMDPRTDSKPDEIYGNSLISTVIDSCNCSDSSDIELSDDWAAKKSPKISRASKSP 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD KLPRISIEARKSPKLPRAAQELSRSPRLPLRKPSVGSPSLTRREFPFEDITQHNYLAQVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 KLPRISIEARKSPKLPRAAQELSRSPRLPLRKPSVGSPSLTRREFPFEDITQHNYLAQVT 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD SNIWGTKFKIVGLAAFLPTNLGAVIYKTSLLHLQPRQMTIYLPEVRKISMDYINLPVFNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SNIWGTKFKIVGLAAFLPTNLGAVIYKTSLLHLQPRQMTIYLPEVRKISMDYINLPVFNP 610 620 630 640 650 660 670 pF1KSD NVFSEDEDDLPGDAVWTD ::::::::::: CCDS34 NVFSEDEDDLPVTGASGVPENSPPCTVNIPIAPIHSSAQAMSPTQSIGLVQSLLANQNVQ 670 680 690 700 710 720 >>CCDS1695.1 WDR35 gene_id:57539|Hs108|chr2 (1170 aa) initn: 355 init1: 188 opt: 395 Z-score: 401.5 bits: 85.5 E(32554): 4.8e-16 Smith-Waterman score: 502; 26.2% identity (53.5% similar) in 493 aa overlap (20-494:5-448) 10 20 30 40 50 pF1KSD MYAAVEHGPVLCSDSNILCLSWKGRVPKSEKEKPVCRRRYYEEGWLATGNGRGVVGV--- :: : .:.. : . : :.:..: :. :.. : CCDS16 MFFYLSKKISIPNNVKLQ--CVSWNKEQGFIACGGEDGLLKVLKL 10 20 30 40 60 70 80 90 100 110 pF1KSD -TFTSSHCRRDRSTPQRINFN--LRGHNSEVVLVRWNEPYQKLATCDADGGIFVWIQYEG : :.. : ..:. ...: :.::.. : .: ::: ::::.: : .: :.::. :.: CCDS16 ETQTDDAKLRGLAAPSNLSMNQTLEGHSGSVQVVTWNEQYQKLTTSDENGLIIVWMLYKG 50 60 70 80 90 100 120 130 140 150 160 170 pF1KSD RWSVELVNDRGAQV-SDFTWSHDGTQALISYRDGFVLVGSVSGQRHWSSEINLESQITCG : :..:.:. .: ...:. :: . : :.:: :.::::.:.: :..... :.. CCDS16 SWIEEMINNRNKSVVRSMSWNADGQKICIVYEDGAVIVGSVDGNRIWGKDLK-GIQLSHV 110 120 130 140 150 160 180 190 200 210 220 230 pF1KSD IWTPDDQQVLFGTADGQVIVMDCHGRMLAHVLLHESDGVLGMSWNYPIFLVEDSSESDTD :. :.. .::: :.:.. ..: .: .. .. : .: : : . CCDS16 TWSADSKVLLFGMANGEIHIYDNQGNFMIKMKLSCLVNVTGAISIAGIHWYHG------- 170 180 190 200 210 240 250 260 270 280 290 pF1KSD SDDYAPPQDGPAAYPIPVQNIKPLLTVSFTSGDISLMNNYDDLSPTVIRSGLKEVVAQWC .. :. :. : :.: : .: ..: . .: .:..: .:. : :: CCDS16 TEGYVEPD-------------CPCLAVCFDNGRCQIMRHENDQNPVLIDTGMYVVGIQWN 220 230 240 250 260 300 310 320 330 340 350 pF1KSD TQGDLLAVAGMERQTQLGELPNGPLLKSAMVKFYNVRGEHIFTLDTLVQRPIISICWGHR .:..:::::... .. . : .:.::. :::. :: . . : .. : CCDS16 HMGSVLAVAGFQKAAMQDKDVN-------IVQFYTPFGEHLGTLK-VPGKEISALSWEGG 270 280 290 300 310 360 370 380 390 400 410 pF1KSD DSRLLMASGPALYVVRVEHRVSSLQLLCQQAIA-STLREDKDVSKLTLPPRLCSYLSTAF .. .: .: . . : . :..... . : :. :. : ..: CCDS16 GLKIALAVDSFIYFANI--RPNYKWGYCSNTVVYAYTRPDR--------PEYC----VVF 320 330 340 350 360 420 430 440 450 460 pF1KSD IPTIKPPIPDPNNMRDFVSYPSAGNERLHCTM--KRTEDDPE--------VGGPCYTLYL : : . .. ..: . :. : . : :. :. .: : :. CCDS16 WDT-KNNEKYVKYVKGLISITTCGD---FCILATKADENHPQFVLVLCNSIGTPLDPKYI 370 380 390 400 410 470 480 490 500 510 520 pF1KSD EYLGGLVPILKGRRISKLRPEFVIMDPRTDSKPDEIYGNSLISTVIDSCNCSDSSDIELS . . .: . : . :. . : . :. .: CCDS16 DIVPLFVAMTKTHVIAASKEAFYTWQYRVAKKLTALEINQITRSRKEGRERIYHVDDTPS 420 430 440 450 460 470 530 540 550 560 570 580 pF1KSD DDWAAKKSPKISRASKSPKLPRISIEARKSPKLPRAAQELSRSPRLPLRKPSVGSPSLTR CCDS16 GSMDGVLDYSKTIQGTRDPICAITASDKILIVGRESGTIQRYSLPNVGLIQKYSLNCRAY 480 490 500 510 520 530 >>CCDS33152.1 WDR35 gene_id:57539|Hs108|chr2 (1181 aa) initn: 355 init1: 188 opt: 395 Z-score: 401.4 bits: 85.5 E(32554): 4.9e-16 Smith-Waterman score: 496; 29.3% identity (57.8% similar) in 358 aa overlap (20-370:5-331) 10 20 30 40 50 pF1KSD MYAAVEHGPVLCSDSNILCLSWKGRVPKSEKEKPVCRRRYYEEGWLATGNGRGVVGV--- :: : .:.. : . : :.:..: :. :.. : CCDS33 MFFYLSKKISIPNNVKLQ--CVSWNKEQGFIACGGEDGLLKVLKL 10 20 30 40 60 70 80 90 100 110 pF1KSD -TFTSSHCRRDRSTPQRINFN--LRGHNSEVVLVRWNEPYQKLATCDADGGIFVWIQYEG : :.. : ..:. ...: :.::.. : .: ::: ::::.: : .: :.::. :.: CCDS33 ETQTDDAKLRGLAAPSNLSMNQTLEGHSGSVQVVTWNEQYQKLTTSDENGLIIVWMLYKG 50 60 70 80 90 100 120 130 140 150 160 170 pF1KSD RWSVELVNDRGAQV-SDFTWSHDGTQALISYRDGFVLVGSVSGQRHWSSEINLESQITCG : :..:.:. .: ...:. :: . : :.:: :.::::.:.: :..... :.. CCDS33 SWIEEMINNRNKSVVRSMSWNADGQKICIVYEDGAVIVGSVDGNRIWGKDLK-GIQLSHV 110 120 130 140 150 160 180 190 200 210 220 230 pF1KSD IWTPDDQQVLFGTADGQVIVMDCHGRMLAHVLLHESDGVLGMSWNYPIFLVEDSSESDTD :. :.. .::: :.:.. ..: .: .. .. : .: : : . . CCDS33 TWSADSKVLLFGMANGEIHIYDNQGNFMIKMKLSCLVNVTGAISIAGIHWYHGT------ 170 180 190 200 210 240 250 260 270 280 290 pF1KSD SDDYAPPQDGPAAYPIPVQNIKPLLTVSFTSGDISLMNNYDDLSPTVIRSGLKEVVAQWC . :. :. : :.: : .: ..: . .: .:..: .:. : :: CCDS33 -EGYVEPD-------------CPCLAVCFDNGRCQIMRHENDQNPVLIDTGMYVVGIQWN 220 230 240 250 260 300 310 320 330 340 350 pF1KSD TQGDLLAVAGMERQTQLGELPNGPLLKSAMVKFYNVRGEHIFTLDTLVQRPIISICWGHR .:..:::::... .. . : .:.::. :::. :: . . : .. : CCDS33 HMGSVLAVAGFQKAAMQDKDVN-------IVQFYTPFGEHLGTLK-VPGKEISALSWEGG 270 280 290 300 310 360 370 380 390 400 410 pF1KSD DSRLLMASGPALYVVRVEHRVSSLQLLCQQAIASTLREDKDVSKLTLPPRLCSYLSTAFI .. .: .: . . CCDS33 GLKIALAVDSFIYFANIRPNYKWGYCSNTVVYAYTRPDRPEYCVVFWDTKNNEKYVKYVK 320 330 340 350 360 370 678 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 06:07:55 2016 done: Thu Nov 3 06:07:55 2016 Total Scan time: 3.870 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]