FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1397, 678 aa
1>>>pF1KSDA1397 678 - 678 aa - 678 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.7674+/-0.000888; mu= 12.5923+/- 0.053
mean_var=95.6016+/-19.002, 0's: 0 Z-trim(107.9): 42 B-trim: 0 in 0/53
Lambda= 0.131172
statistics sampled from 9872 (9894) to 9872 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.663), E-opt: 0.2 (0.304), width: 16
Scan time: 3.870
The best scores are: opt bits E(32554)
CCDS34562.1 TULP4 gene_id:56995|Hs108|chr6 ( 678) 4629 886.6 0
CCDS34561.1 TULP4 gene_id:56995|Hs108|chr6 (1543) 4575 876.5 0
CCDS1695.1 WDR35 gene_id:57539|Hs108|chr2 (1170) 395 85.5 4.8e-16
CCDS33152.1 WDR35 gene_id:57539|Hs108|chr2 (1181) 395 85.5 4.9e-16
>>CCDS34562.1 TULP4 gene_id:56995|Hs108|chr6 (678 aa)
initn: 4629 init1: 4629 opt: 4629 Z-score: 4735.6 bits: 886.6 E(32554): 0
Smith-Waterman score: 4629; 100.0% identity (100.0% similar) in 678 aa overlap (1-678:1-678)
10 20 30 40 50 60
pF1KSD MYAAVEHGPVLCSDSNILCLSWKGRVPKSEKEKPVCRRRYYEEGWLATGNGRGVVGVTFT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 MYAAVEHGPVLCSDSNILCLSWKGRVPKSEKEKPVCRRRYYEEGWLATGNGRGVVGVTFT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD SSHCRRDRSTPQRINFNLRGHNSEVVLVRWNEPYQKLATCDADGGIFVWIQYEGRWSVEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 SSHCRRDRSTPQRINFNLRGHNSEVVLVRWNEPYQKLATCDADGGIFVWIQYEGRWSVEL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD VNDRGAQVSDFTWSHDGTQALISYRDGFVLVGSVSGQRHWSSEINLESQITCGIWTPDDQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 VNDRGAQVSDFTWSHDGTQALISYRDGFVLVGSVSGQRHWSSEINLESQITCGIWTPDDQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD QVLFGTADGQVIVMDCHGRMLAHVLLHESDGVLGMSWNYPIFLVEDSSESDTDSDDYAPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 QVLFGTADGQVIVMDCHGRMLAHVLLHESDGVLGMSWNYPIFLVEDSSESDTDSDDYAPP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD QDGPAAYPIPVQNIKPLLTVSFTSGDISLMNNYDDLSPTVIRSGLKEVVAQWCTQGDLLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 QDGPAAYPIPVQNIKPLLTVSFTSGDISLMNNYDDLSPTVIRSGLKEVVAQWCTQGDLLA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD VAGMERQTQLGELPNGPLLKSAMVKFYNVRGEHIFTLDTLVQRPIISICWGHRDSRLLMA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 VAGMERQTQLGELPNGPLLKSAMVKFYNVRGEHIFTLDTLVQRPIISICWGHRDSRLLMA
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD SGPALYVVRVEHRVSSLQLLCQQAIASTLREDKDVSKLTLPPRLCSYLSTAFIPTIKPPI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 SGPALYVVRVEHRVSSLQLLCQQAIASTLREDKDVSKLTLPPRLCSYLSTAFIPTIKPPI
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD PDPNNMRDFVSYPSAGNERLHCTMKRTEDDPEVGGPCYTLYLEYLGGLVPILKGRRISKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PDPNNMRDFVSYPSAGNERLHCTMKRTEDDPEVGGPCYTLYLEYLGGLVPILKGRRISKL
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD RPEFVIMDPRTDSKPDEIYGNSLISTVIDSCNCSDSSDIELSDDWAAKKSPKISRASKSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 RPEFVIMDPRTDSKPDEIYGNSLISTVIDSCNCSDSSDIELSDDWAAKKSPKISRASKSP
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD KLPRISIEARKSPKLPRAAQELSRSPRLPLRKPSVGSPSLTRREFPFEDITQHNYLAQVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 KLPRISIEARKSPKLPRAAQELSRSPRLPLRKPSVGSPSLTRREFPFEDITQHNYLAQVT
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD SNIWGTKFKIVGLAAFLPTNLGAVIYKTSLLHLQPRQMTIYLPEVRKISMDYINLPVFNP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 SNIWGTKFKIVGLAAFLPTNLGAVIYKTSLLHLQPRQMTIYLPEVRKISMDYINLPVFNP
610 620 630 640 650 660
670
pF1KSD NVFSEDEDDLPGDAVWTD
::::::::::::::::::
CCDS34 NVFSEDEDDLPGDAVWTD
670
>>CCDS34561.1 TULP4 gene_id:56995|Hs108|chr6 (1543 aa)
initn: 4575 init1: 4575 opt: 4575 Z-score: 4674.7 bits: 876.5 E(32554): 0
Smith-Waterman score: 4575; 100.0% identity (100.0% similar) in 671 aa overlap (1-671:1-671)
10 20 30 40 50 60
pF1KSD MYAAVEHGPVLCSDSNILCLSWKGRVPKSEKEKPVCRRRYYEEGWLATGNGRGVVGVTFT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 MYAAVEHGPVLCSDSNILCLSWKGRVPKSEKEKPVCRRRYYEEGWLATGNGRGVVGVTFT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD SSHCRRDRSTPQRINFNLRGHNSEVVLVRWNEPYQKLATCDADGGIFVWIQYEGRWSVEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 SSHCRRDRSTPQRINFNLRGHNSEVVLVRWNEPYQKLATCDADGGIFVWIQYEGRWSVEL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD VNDRGAQVSDFTWSHDGTQALISYRDGFVLVGSVSGQRHWSSEINLESQITCGIWTPDDQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 VNDRGAQVSDFTWSHDGTQALISYRDGFVLVGSVSGQRHWSSEINLESQITCGIWTPDDQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD QVLFGTADGQVIVMDCHGRMLAHVLLHESDGVLGMSWNYPIFLVEDSSESDTDSDDYAPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 QVLFGTADGQVIVMDCHGRMLAHVLLHESDGVLGMSWNYPIFLVEDSSESDTDSDDYAPP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD QDGPAAYPIPVQNIKPLLTVSFTSGDISLMNNYDDLSPTVIRSGLKEVVAQWCTQGDLLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 QDGPAAYPIPVQNIKPLLTVSFTSGDISLMNNYDDLSPTVIRSGLKEVVAQWCTQGDLLA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD VAGMERQTQLGELPNGPLLKSAMVKFYNVRGEHIFTLDTLVQRPIISICWGHRDSRLLMA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 VAGMERQTQLGELPNGPLLKSAMVKFYNVRGEHIFTLDTLVQRPIISICWGHRDSRLLMA
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD SGPALYVVRVEHRVSSLQLLCQQAIASTLREDKDVSKLTLPPRLCSYLSTAFIPTIKPPI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 SGPALYVVRVEHRVSSLQLLCQQAIASTLREDKDVSKLTLPPRLCSYLSTAFIPTIKPPI
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD PDPNNMRDFVSYPSAGNERLHCTMKRTEDDPEVGGPCYTLYLEYLGGLVPILKGRRISKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PDPNNMRDFVSYPSAGNERLHCTMKRTEDDPEVGGPCYTLYLEYLGGLVPILKGRRISKL
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD RPEFVIMDPRTDSKPDEIYGNSLISTVIDSCNCSDSSDIELSDDWAAKKSPKISRASKSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 RPEFVIMDPRTDSKPDEIYGNSLISTVIDSCNCSDSSDIELSDDWAAKKSPKISRASKSP
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD KLPRISIEARKSPKLPRAAQELSRSPRLPLRKPSVGSPSLTRREFPFEDITQHNYLAQVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 KLPRISIEARKSPKLPRAAQELSRSPRLPLRKPSVGSPSLTRREFPFEDITQHNYLAQVT
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD SNIWGTKFKIVGLAAFLPTNLGAVIYKTSLLHLQPRQMTIYLPEVRKISMDYINLPVFNP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 SNIWGTKFKIVGLAAFLPTNLGAVIYKTSLLHLQPRQMTIYLPEVRKISMDYINLPVFNP
610 620 630 640 650 660
670
pF1KSD NVFSEDEDDLPGDAVWTD
:::::::::::
CCDS34 NVFSEDEDDLPVTGASGVPENSPPCTVNIPIAPIHSSAQAMSPTQSIGLVQSLLANQNVQ
670 680 690 700 710 720
>>CCDS1695.1 WDR35 gene_id:57539|Hs108|chr2 (1170 aa)
initn: 355 init1: 188 opt: 395 Z-score: 401.5 bits: 85.5 E(32554): 4.8e-16
Smith-Waterman score: 502; 26.2% identity (53.5% similar) in 493 aa overlap (20-494:5-448)
10 20 30 40 50
pF1KSD MYAAVEHGPVLCSDSNILCLSWKGRVPKSEKEKPVCRRRYYEEGWLATGNGRGVVGV---
:: : .:.. : . : :.:..: :. :.. :
CCDS16 MFFYLSKKISIPNNVKLQ--CVSWNKEQGFIACGGEDGLLKVLKL
10 20 30 40
60 70 80 90 100 110
pF1KSD -TFTSSHCRRDRSTPQRINFN--LRGHNSEVVLVRWNEPYQKLATCDADGGIFVWIQYEG
: :.. : ..:. ...: :.::.. : .: ::: ::::.: : .: :.::. :.:
CCDS16 ETQTDDAKLRGLAAPSNLSMNQTLEGHSGSVQVVTWNEQYQKLTTSDENGLIIVWMLYKG
50 60 70 80 90 100
120 130 140 150 160 170
pF1KSD RWSVELVNDRGAQV-SDFTWSHDGTQALISYRDGFVLVGSVSGQRHWSSEINLESQITCG
: :..:.:. .: ...:. :: . : :.:: :.::::.:.: :..... :..
CCDS16 SWIEEMINNRNKSVVRSMSWNADGQKICIVYEDGAVIVGSVDGNRIWGKDLK-GIQLSHV
110 120 130 140 150 160
180 190 200 210 220 230
pF1KSD IWTPDDQQVLFGTADGQVIVMDCHGRMLAHVLLHESDGVLGMSWNYPIFLVEDSSESDTD
:. :.. .::: :.:.. ..: .: .. .. : .: : : .
CCDS16 TWSADSKVLLFGMANGEIHIYDNQGNFMIKMKLSCLVNVTGAISIAGIHWYHG-------
170 180 190 200 210
240 250 260 270 280 290
pF1KSD SDDYAPPQDGPAAYPIPVQNIKPLLTVSFTSGDISLMNNYDDLSPTVIRSGLKEVVAQWC
.. :. :. : :.: : .: ..: . .: .:..: .:. : ::
CCDS16 TEGYVEPD-------------CPCLAVCFDNGRCQIMRHENDQNPVLIDTGMYVVGIQWN
220 230 240 250 260
300 310 320 330 340 350
pF1KSD TQGDLLAVAGMERQTQLGELPNGPLLKSAMVKFYNVRGEHIFTLDTLVQRPIISICWGHR
.:..:::::... .. . : .:.::. :::. :: . . : .. :
CCDS16 HMGSVLAVAGFQKAAMQDKDVN-------IVQFYTPFGEHLGTLK-VPGKEISALSWEGG
270 280 290 300 310
360 370 380 390 400 410
pF1KSD DSRLLMASGPALYVVRVEHRVSSLQLLCQQAIA-STLREDKDVSKLTLPPRLCSYLSTAF
.. .: .: . . : . :..... . : :. :. : ..:
CCDS16 GLKIALAVDSFIYFANI--RPNYKWGYCSNTVVYAYTRPDR--------PEYC----VVF
320 330 340 350 360
420 430 440 450 460
pF1KSD IPTIKPPIPDPNNMRDFVSYPSAGNERLHCTM--KRTEDDPE--------VGGPCYTLYL
: : . .. ..: . :. : . : :. :. .: : :.
CCDS16 WDT-KNNEKYVKYVKGLISITTCGD---FCILATKADENHPQFVLVLCNSIGTPLDPKYI
370 380 390 400 410
470 480 490 500 510 520
pF1KSD EYLGGLVPILKGRRISKLRPEFVIMDPRTDSKPDEIYGNSLISTVIDSCNCSDSSDIELS
. . .: . : . :. . : . :. .:
CCDS16 DIVPLFVAMTKTHVIAASKEAFYTWQYRVAKKLTALEINQITRSRKEGRERIYHVDDTPS
420 430 440 450 460 470
530 540 550 560 570 580
pF1KSD DDWAAKKSPKISRASKSPKLPRISIEARKSPKLPRAAQELSRSPRLPLRKPSVGSPSLTR
CCDS16 GSMDGVLDYSKTIQGTRDPICAITASDKILIVGRESGTIQRYSLPNVGLIQKYSLNCRAY
480 490 500 510 520 530
>>CCDS33152.1 WDR35 gene_id:57539|Hs108|chr2 (1181 aa)
initn: 355 init1: 188 opt: 395 Z-score: 401.4 bits: 85.5 E(32554): 4.9e-16
Smith-Waterman score: 496; 29.3% identity (57.8% similar) in 358 aa overlap (20-370:5-331)
10 20 30 40 50
pF1KSD MYAAVEHGPVLCSDSNILCLSWKGRVPKSEKEKPVCRRRYYEEGWLATGNGRGVVGV---
:: : .:.. : . : :.:..: :. :.. :
CCDS33 MFFYLSKKISIPNNVKLQ--CVSWNKEQGFIACGGEDGLLKVLKL
10 20 30 40
60 70 80 90 100 110
pF1KSD -TFTSSHCRRDRSTPQRINFN--LRGHNSEVVLVRWNEPYQKLATCDADGGIFVWIQYEG
: :.. : ..:. ...: :.::.. : .: ::: ::::.: : .: :.::. :.:
CCDS33 ETQTDDAKLRGLAAPSNLSMNQTLEGHSGSVQVVTWNEQYQKLTTSDENGLIIVWMLYKG
50 60 70 80 90 100
120 130 140 150 160 170
pF1KSD RWSVELVNDRGAQV-SDFTWSHDGTQALISYRDGFVLVGSVSGQRHWSSEINLESQITCG
: :..:.:. .: ...:. :: . : :.:: :.::::.:.: :..... :..
CCDS33 SWIEEMINNRNKSVVRSMSWNADGQKICIVYEDGAVIVGSVDGNRIWGKDLK-GIQLSHV
110 120 130 140 150 160
180 190 200 210 220 230
pF1KSD IWTPDDQQVLFGTADGQVIVMDCHGRMLAHVLLHESDGVLGMSWNYPIFLVEDSSESDTD
:. :.. .::: :.:.. ..: .: .. .. : .: : : . .
CCDS33 TWSADSKVLLFGMANGEIHIYDNQGNFMIKMKLSCLVNVTGAISIAGIHWYHGT------
170 180 190 200 210
240 250 260 270 280 290
pF1KSD SDDYAPPQDGPAAYPIPVQNIKPLLTVSFTSGDISLMNNYDDLSPTVIRSGLKEVVAQWC
. :. :. : :.: : .: ..: . .: .:..: .:. : ::
CCDS33 -EGYVEPD-------------CPCLAVCFDNGRCQIMRHENDQNPVLIDTGMYVVGIQWN
220 230 240 250 260
300 310 320 330 340 350
pF1KSD TQGDLLAVAGMERQTQLGELPNGPLLKSAMVKFYNVRGEHIFTLDTLVQRPIISICWGHR
.:..:::::... .. . : .:.::. :::. :: . . : .. :
CCDS33 HMGSVLAVAGFQKAAMQDKDVN-------IVQFYTPFGEHLGTLK-VPGKEISALSWEGG
270 280 290 300 310
360 370 380 390 400 410
pF1KSD DSRLLMASGPALYVVRVEHRVSSLQLLCQQAIASTLREDKDVSKLTLPPRLCSYLSTAFI
.. .: .: . .
CCDS33 GLKIALAVDSFIYFANIRPNYKWGYCSNTVVYAYTRPDRPEYCVVFWDTKNNEKYVKYVK
320 330 340 350 360 370
678 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 06:07:55 2016 done: Thu Nov 3 06:07:55 2016
Total Scan time: 3.870 Total Display time: 0.060
Function used was FASTA [36.3.4 Apr, 2011]