FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB8595, 2202 aa
1>>>pF1KB8595 2202 - 2202 aa - 2202 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.9218+/-0.00149; mu= 15.9986+/- 0.090
mean_var=75.5812+/-14.715, 0's: 0 Z-trim(97.8): 46 B-trim: 10 in 1/49
Lambda= 0.147526
statistics sampled from 5133 (5163) to 5133 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.48), E-opt: 0.2 (0.159), width: 16
Scan time: 5.460
The best scores are: opt bits E(32554)
CCDS5046.1 ASCC3 gene_id:10973|Hs108|chr6 (2202) 14512 3099.6 0
CCDS2020.1 SNRNP200 gene_id:23020|Hs108|chr2 (2136) 5023 1080.0 0
CCDS75497.1 ASCC3 gene_id:10973|Hs108|chr6 ( 731) 4671 1005.1 0
CCDS30769.2 HFM1 gene_id:164045|Hs108|chr1 (1435) 1103 245.7 1.1e-63
CCDS5047.1 ASCC3 gene_id:10973|Hs108|chr6 ( 111) 501 117.7 3e-26
>>CCDS5046.1 ASCC3 gene_id:10973|Hs108|chr6 (2202 aa)
initn: 14512 init1: 14512 opt: 14512 Z-score: 16677.1 bits: 3099.6 E(32554): 0
Smith-Waterman score: 14512; 99.9% identity (99.9% similar) in 2202 aa overlap (1-2202:1-2202)
10 20 30 40 50 60
pF1KB8 MALPRLTGALRSFSNVTKQDNYNEEVADLKIKRSKLHEQVLDLGLTWKKIIKFLNEKLEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 MALPRLTGALRSFSNVTKQDNYNEEVADLKIKRSKLHEQVLDLGLTWKKIIKFLNEKLEK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB8 SKMQSINEDLKDILHAAKQIVGTDNGREAIESGAAFLFMTFHLKDSVGHKETKAIKQMFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 SKMQSINEDLKDILHAAKQIVGTDNGREAIESGAAFLFMTFHLKDSVGHKETKAIKQMFG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB8 PFPSSSATAACNATNRIISHFSQDDFTALVQMTEKEHGDRVFFGKNLAFSFDMHDLDHFD
:::::::::::::::::::::::::.::::::::::::::::::::::::::::::::::
CCDS50 PFPSSSATAACNATNRIISHFSQDDLTALVQMTEKEHGDRVFFGKNLAFSFDMHDLDHFD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB8 ELPINGETQKTISLDYKKFLNEHLQEACTPELKPVEKTNGSFLWCEVEKYLNSTLKEMTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 ELPINGETQKTISLDYKKFLNEHLQEACTPELKPVEKTNGSFLWCEVEKYLNSTLKEMTE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB8 VPRVEDLCCTLYDMLASIKSGDELQDELFELLGPEGLELIEKLLQNRITIVDRFLNSSND
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 VPRVEDLCCTLYDMLASIKSGDELQDELFELLGPEGLELIEKLLQNRITIVDRFLNSSND
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB8 HRFQALQDNCKKILGENAKPNYGCQVTIQSEQEKQLMKQYRREEKRIARREKKAGEDLEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 HRFQALQDNCKKILGENAKPNYGCQVTIQSEQEKQLMKQYRREEKRIARREKKAGEDLEV
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB8 SEGLMCFDPKELRIQREQALLNARSVPILSRQRDADVEKIHYPHVYDSQAEAMKTSAFIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 SEGLMCFDPKELRIQREQALLNARSVPILSRQRDADVEKIHYPHVYDSQAEAMKTSAFIA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB8 GAKMILPEGIQRENNKLYEEVRISYSEPMPLSFEEKPVYIQDLDEIGQLAFKGMKRLNRI
::::::::::::::::::::::: ::::::::::::::::::::::::::::::::::::
CCDS50 GAKMILPEGIQRENNKLYEEVRIPYSEPMPLSFEEKPVYIQDLDEIGQLAFKGMKRLNRI
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB8 QSIVFETAYNTNENMLICAPTGAGKTNIAMLTVLHEIRQHFQQGVIKKNEFKIVYVAPMK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 QSIVFETAYNTNENMLICAPTGAGKTNIAMLTVLHEIRQHFQQGVIKKNEFKIVYVAPMK
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB8 ALAAEMTDYFSRRLEPLGIIVKELTGDMQLSKSEILRTQMLVTTPEKWDVVTRKSVGDVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 ALAAEMTDYFSRRLEPLGIIVKELTGDMQLSKSEILRTQMLVTTPEKWDVVTRKSVGDVA
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB8 LSQIVRLLILDEVHLLHEDRGPVLESIVARTLRQVESTQSMIRILGLSATLPNYLDVATF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 LSQIVRLLILDEVHLLHEDRGPVLESIVARTLRQVESTQSMIRILGLSATLPNYLDVATF
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB8 LHVNPYIGLFFFDGRFRPVPLGQTFLGIKCANKMQQLNNMDEVCYENVLKQVKAGHQVMV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 LHVNPYIGLFFFDGRFRPVPLGQTFLGIKCANKMQQLNNMDEVCYENVLKQVKAGHQVMV
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB8 FVHARNATVRTAMSLIERAKNCGHIPFFFSTQGHDYVLAEKQVQRSRNKQVRELFPDGFS
::::::::::::::::::::::::::::: ::::::::::::::::::::::::::::::
CCDS50 FVHARNATVRTAMSLIERAKNCGHIPFFFPTQGHDYVLAEKQVQRSRNKQVRELFPDGFS
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB8 IHHAGMLRQDRNLVENLFSNGHIKVLVCTATLAWGVNLPAHAVIIKGTQIYAAKRGSFVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 IHHAGMLRQDRNLVENLFSNGHIKVLVCTATLAWGVNLPAHAVIIKGTQIYAAKRGSFVD
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB8 LGILDVMQIFGRAGRPQFDKFGEGIIITTHDKLSHYLTLLTQRNPIESQFLESLADNLNA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 LGILDVMQIFGRAGRPQFDKFGEGIIITTHDKLSHYLTLLTQRNPIESQFLESLADNLNA
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB8 EIALGTVTNVEEAVKWISYTYLYVRMRANPLAYGISHKAYQIDPTLRKHREQLVIEVGRK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 EIALGTVTNVEEAVKWISYTYLYVRMRANPLAYGISHKAYQIDPTLRKHREQLVIEVGRK
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB8 LDKAQMIRFEERTGYFSSTDLGRTASHYYIKYNTIETFNELFDAHKTEGDIFAIVSKAEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 LDKAQMIRFEERTGYFSSTDLGRTASHYYIKYNTIETFNELFDAHKTEGDIFAIVSKAEE
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KB8 FDQIKVREEEIEELDTLLSNFCELSTPGGVENSYGKINILLQTYISRGEMDSFSLISDSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 FDQIKVREEEIEELDTLLSNFCELSTPGGVENSYGKINILLQTYISRGEMDSFSLISDSA
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KB8 YVAQNAARIVRALFEIALRKRWPTMTYRLLNLSKVIDKRLWGWASPLRQFSILPPHILTR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 YVAQNAARIVRALFEIALRKRWPTMTYRLLNLSKVIDKRLWGWASPLRQFSILPPHILTR
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KB8 LEEKKLTVDKLKDMRKDEIGHILHHVNIGLKVKQCVHQIPSVMMEASIQPITRTVLRVTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 LEEKKLTVDKLKDMRKDEIGHILHHVNIGLKVKQCVHQIPSVMMEASIQPITRTVLRVTL
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KB8 SIYADFTWNDQVHGTVGEPWWIWVEDPTNDHIYHSEYFLALKKQVISKEAQLLVFTIPIF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 SIYADFTWNDQVHGTVGEPWWIWVEDPTNDHIYHSEYFLALKKQVISKEAQLLVFTIPIF
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KB8 EPLPSQYYIRAVSDRWLGAEAVCIINFQHLILPERHPPHTELLDLQPLPITALGCKAYEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 EPLPSQYYIRAVSDRWLGAEAVCIINFQHLILPERHPPHTELLDLQPLPITALGCKAYEA
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KB8 LYNFSHFNPVQTQIFHTLYHTDCNVLLGAPTGSGKTVAAELAIFRVFNKYPTSKAVYIAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 LYNFSHFNPVQTQIFHTLYHTDCNVLLGAPTGSGKTVAAELAIFRVFNKYPTSKAVYIAP
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KB8 LKALVRERMDDWKVRIEEKLGKKVIELTGDVTPDMKSIAKADLIVTTPEKWDGVSRSWQN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 LKALVRERMDDWKVRIEEKLGKKVIELTGDVTPDMKSIAKADLIVTTPEKWDGVSRSWQN
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KB8 RNYVQQVTILIIDEIHLLGEERGPVLEVIVSRTNFISSHTEKPVRIVGLSTALANARDLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 RNYVQQVTILIIDEIHLLGEERGPVLEVIVSRTNFISSHTEKPVRIVGLSTALANARDLA
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KB8 DWLNIKQMGLFNFRPSVRPVPLEVHIQGFPGQHYCPRMASMNKPAFQAIRSHSPAKPVLI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 DWLNIKQMGLFNFRPSVRPVPLEVHIQGFPGQHYCPRMASMNKPAFQAIRSHSPAKPVLI
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KB8 FVSSRRQTRLTALELIAFLATEEDPKQWLNMDEREMENIIATVRDSNLKLTLAFGIGMHH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 FVSSRRQTRLTALELIAFLATEEDPKQWLNMDEREMENIIATVRDSNLKLTLAFGIGMHH
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KB8 AGLHERDRKTVEELFVNCKVQVLIATSTLAWGVNFPAHLVIIKGTEYYDGKTRRYVDFPI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 AGLHERDRKTVEELFVNCKVQVLIATSTLAWGVNFPAHLVIIKGTEYYDGKTRRYVDFPI
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KB8 TDVLQMMGRAGRPQFDDQGKAVILVHDIKKDFYKKFLYEPFPVESSLLGVLSDHLNAEIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 TDVLQMMGRAGRPQFDDQGKAVILVHDIKKDFYKKFLYEPFPVESSLLGVLSDHLNAEIA
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KB8 GGTITSKQDALDYITWTYFFRRLIMNPSYYNLGDVSHDSVNKFLSHLIEKSLIELELSYC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 GGTITSKQDALDYITWTYFFRRLIMNPSYYNLGDVSHDSVNKFLSHLIEKSLIELELSYC
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KB8 IEIGEDNRSIEPLTYGRIASYYYLKHQTVKMFKDRLKPECSTEELLSILSDAEEYTDLPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 IEIGEDNRSIEPLTYGRIASYYYLKHQTVKMFKDRLKPECSTEELLSILSDAEEYTDLPV
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KB8 RHNEDHMNSELAKCLPIESNPHSFDSPHTKAHLLLQAHLSRAMLPCPDYDTDTKTVLDQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 RHNEDHMNSELAKCLPIESNPHSFDSPHTKAHLLLQAHLSRAMLPCPDYDTDTKTVLDQA
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KB8 LRVCQAMLDVAANQGWLVTVLNITNLIQMVIQGRWLKDSSLLTLPNIENHHLHLFKKWKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 LRVCQAMLDVAANQGWLVTVLNITNLIQMVIQGRWLKDSSLLTLPNIENHHLHLFKKWKP
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KB8 IMKGPHARGRTSIESLPELIHACGGKDHVFSSMVESELHAAKTKQAWNFLSHLPVINVGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 IMKGPHARGRTSIESLPELIHACGGKDHVFSSMVESELHAAKTKQAWNFLSHLPVINVGI
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KB8 SVKGSWDDLVEGHNELSVSTLTADKRDDNKWIKLHADQEYVLQVSLQRVHFGFHKGKPES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 SVKGSWDDLVEGHNELSVSTLTADKRDDNKWIKLHADQEYVLQVSLQRVHFGFHKGKPES
2050 2060 2070 2080 2090 2100
2110 2120 2130 2140 2150 2160
pF1KB8 CAVTPRFPKSKDEGWFLILGEVDKRELIALKRVGYIRNHHVASLSFYTPEIPGRYIYTLY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 CAVTPRFPKSKDEGWFLILGEVDKRELIALKRVGYIRNHHVASLSFYTPEIPGRYIYTLY
2110 2120 2130 2140 2150 2160
2170 2180 2190 2200
pF1KB8 FMSDCYLGLDQQYDIYLNVTQASLSAQVNTKVSDSLTDLALK
::::::::::::::::::::::::::::::::::::::::::
CCDS50 FMSDCYLGLDQQYDIYLNVTQASLSAQVNTKVSDSLTDLALK
2170 2180 2190 2200
>>CCDS2020.1 SNRNP200 gene_id:23020|Hs108|chr2 (2136 aa)
initn: 4450 init1: 1694 opt: 5023 Z-score: 5762.6 bits: 1080.0 E(32554): 0
Smith-Waterman score: 5176; 40.2% identity (70.2% similar) in 2141 aa overlap (60-2182:103-2129)
30 40 50 60 70 80
pF1KB8 KIKRSKLHEQVLDLGLTWKKIIKFLNEKLEKSKMQSINEDLKDILHAAKQIVGTDNGREA
: : . : . .: . .: :. :.
CCDS20 KRDEDRHDINKMKGYTLLSEGIDEMVGIIYKPKTKETRETYEVLLSFIQAALG-DQPRD-
80 90 100 110 120 130
90 100 110 120 130 140
pF1KB8 IESGAAFLFMTFHLKDSVGHKET-KAIKQMFGPFPSSSATAACNATNRIISHFSQDDFTA
: ::: .. .... :: : : ..: .. . : ..: .. .. ..
CCDS20 ILCGAADEVLAVLKNEKLRDKERRKEIDLLLGQTDDTRYHVLVNLGKKITDYGGDKEIQN
140 150 160 170 180 190
150 160 170 180 190 200
pF1KB8 LVQMTEKEHGDRVFFGKNLAFSFDMHDLDHFDELPINGETQKTISLD--------YKKFL
. .. :... : :. : : .. :. . ::... : : . :
CCDS20 M-----DDNIDETY-GVNVQFESDEEEGDE----DVYGEVREEASDDDMEGDEAVVRCTL
200 210 220 230 240
210 220 230 240 250
pF1KB8 NEHL---QEACTPELKPVEKTNGSFLWCEVEKYLNSTLKEMTEVPRVEDLCCTLYDMLAS
. .: : . . : .. . . .: ... :. . . : . ..: .
CCDS20 SANLVASGELMSSKKKDLHPRDIDAFW--LQRQLSRFYDDAIVSQKKAD---EVLEILKT
250 260 270 280 290
260 270 280 290 300 310
pF1KB8 IKSGDELQDELFELLGPEGLELIEKLLQNRITIVDRFLNSSNDHRFQALQDNCKKILGE-
.. : ...: ::: . ...:. : :.:. :. : .: . . . ..:.:.
CCDS20 ASDDRECENQLVLLLGFNTFDFIKVLRQHRMMILYCTLLASAQSEAEK-----ERIMGKM
300 310 320 330 340 350
320 330 340 350 360 370
pF1KB8 NAKPNYGCQVTIQSEQEKQ-LMKQYRREEKRIARREKKAGEDLEVSEGLMCFDPKELRIQ
.: :. . . : ::. :... : ...:. :... :::. : .: :
CCDS20 EADPELSKFLYQLHETEKEDLIREERSRRERV--RQSRMDTDLET----MDLD------Q
360 370 380 390
380 390 400 410 420 430
pF1KB8 REQALLNARSVPILSRQRDADVEKIHYPHVYDSQAEAMKTSAFIAGAKMILPEGIQRENN
.:: .: :: :.: . . . : :.:. . ::.: :..
CCDS20 GGEAL-----AP---RQV-LDLEDLVFT----------QGSHFMANKRCQLPDGSFRRQR
400 410 420 430
440 450 460 470 480 490
pF1KB8 KLYEEVRISYSEPMPLSFEEKPVYIQDLDEIGQLAFKGMKRLNRIQSIVFETAYNTNENM
: ::::.. .: :.. ::. . .. : . .: .:.:.: :::::: ....: .:.::.
CCDS20 KGYEEVHVPALKPKPFGSEEQLLPVEKLPKYAQAGFEGFKTLNRIQSKLYRAALETDENL
440 450 460 470 480 490
500 510 520 530 540 550
pF1KB8 LICAPTGAGKTNIAMLTVLHEIRQHFQQ-GVIKKNEFKIVYVAPMKALAAEMTDYFSRRL
:.::::::::::.:.. .:.:: .:... :.:. ..:::.:.:::..:. ::. :..::
CCDS20 LLCAPTGAGKTNVALMCMLREIGKHINMDGTINVDDFKIIYIAPMRSLVQEMVGSFGKRL
500 510 520 530 540 550
560 570 580 590 600 610
pF1KB8 EPLGIIVKELTGDMQLSKSEILRTQMLVTTPEKWDVVTRKSVGDVALSQIVRLLILDEVH
:: : ::::: :: : :: ::..: ::::::..:::. :. . .:.:::.::::.:
CCDS20 ATYGITVAELTGDHQLCKEEISATQIIVCTPEKWDIITRKG-GERTYTQLVRLIILDEIH
560 570 580 590 600 610
620 630 640 650 660 670
pF1KB8 LLHEDRGPVLESIVARTLRQVESTQSMIRILGLSATLPNYLDVATFLHVNPYIGLFFFDG
:::.:::::::..:::..:..: :: .:..::::::::: ::::::.:.: :::.::.
CCDS20 LLHDDRGPVLEALVARAIRNIEMTQEDVRLIGLSATLPNYEDVATFLRVDPAKGLFYFDN
620 630 640 650 660 670
680 690 700 710 720 730
pF1KB8 RFRPVPLGQTFLGIKCANKMQQLNNMDEVCYENVLKQVKAG-HQVMVFVHARNATVRTAM
:::::: ::..:: . ..... :.:. ::..... :: .::.::::.:. : .::
CCDS20 SFRPVPLEQTYVGITEKKAIKRFQIMNEIVYEKIMEH--AGKNQVLVFVHSRKETGKTAR
680 690 700 710 720 730
740 750 760 770 780 790
pF1KB8 SLIERAKNCGHIPFFFSTQGHDYVLAEKQVQRSRNKQVRELFPDGFSIHHAGMLRQDRNL
.. . . . .:. . . . . .... .: ....:.: ::.:::::: : ::.:
CCDS20 AIRDMCLEKDTLGLFLREGSASTEVLRTEAEQCKNLELKDLLPYGFAIHHAGMTRVDRTL
740 750 760 770 780 790
800 810 820 830 840 850
pF1KB8 VENLFSNGHIKVLVCTATLAWGVNLPAHAVIIKGTQIYAAKRGSFVDLGILDVMQIFGRA
::.::.. ::.::: :::::::::::::.:::::::.:. ..: ...:: ::..:..:::
CCDS20 VEDLFADKHIQVLVSTATLAWGVNLPAHTVIIKGTQVYSPEKGRWTELGALDILQMLGRA
800 810 820 830 840 850
860 870 880 890 900 910
pF1KB8 GRPQFDKFGEGIIITTHDKLSHYLTLLTQRNPIESQFLESLADNLNAEIALGTVTNVEEA
::::.: ::::.::.: .:..::.::.:. :::::.. .: : :::::.::.: :...:
CCDS20 GRPQYDTKGEGILITSHGELQYYLSLLNQQLPIESQMVSKLPDMLNAEIVLGNVQNAKDA
860 870 880 890 900 910
920 930 940 950 960 970
pF1KB8 VKWISYTYLYVRMRANPLAYGISHKAYQIDPTLRKHREQLVIEVGRKLDKAQMIRFEERT
:.:..:.:::.:: .: ::::: . :: : ..: .:: .. ::: ........:
CCDS20 VNWLGYAYLYIRMLRSPTLYGISHDDLKGDPLLDQRRLDLVHTAALMLDKNNLVKYDKKT
920 930 940 950 960 970
980 990 1000 1010 1020 1030
pF1KB8 GYFSSTDLGRTASHYYIKYNTIETFNELFDAHKTEGDIFAIVSKAEEFDQIKVREEEIEE
: :. :.::: :::::: .:..:.:.:. .: ..: . : . :: .: ::::: :
CCDS20 GNFQVTELGRIASHYYITNDTVQTYNQLLKPTLSEIELFRVFSLSSEFKNITVREEEKLE
980 990 1000 1010 1020 1030
1040 1050 1060 1070 1080 1090
pF1KB8 LDTLLSNFCELSTPGGVENSYGKINILLQTYISRGEMDSFSLISDSAYVAQNAARIVRAL
:. :: . . ..:. .:::.:::..::. ....:.:..: .::.:.:.:..::.
CCDS20 LQKLLERV-PIPVKESIEEPSAKINVLLQAFISQLKLEGFALMADMVYVTQSAGRLMRAI
1040 1050 1060 1070 1080 1090
1100 1110 1120 1130 1140 1150
pF1KB8 FEIALRKRWPTMTYRLLNLSKVIDKRLWGWASPLRQFSILPPHILTRLEEKKLTVDKLKD
:::.: . : .: . ::: :.::::.: ::::: :: ... ..:.:.. ..: :
CCDS20 FEIVLNRGWAQLTDKTLNLCKMIDKRMWQSMCPLRQFRKLPEEVVKKIEKKNFPFERLYD
1100 1110 1120 1130 1140 1150
1160 1170 1180 1190 1200 1210
pF1KB8 MRKDEIGHILHHVNIGLKVKQCVHQIPSVMMEASIQPITRTVLRVTLSIYADFTWNDQVH
. ..:::.... ..: ... :: .:.. . . .:::::..:.: :.: :: :...::
CCDS20 LNHNEIGELIRMPKMGKTIHKYVHLFPKLELSVHLQPITRSTLKVELTITPDFQWDEKVH
1160 1170 1180 1190 1200 1210
1220 1230 1240 1250 1260 1270
pF1KB8 GTVGEPWWIWVEDPTNDHIYHSEYFLALKKQVISKEAQLLVFTIPIFEPLPSQYYIRAVS
:. .: .:: ::: .. : : :::: :: . ... .:..: .:.::::: ::.::.::
CCDS20 GS-SEAFWILVEDVDSEVILHHEYFL-LKAKY-AQDEHLITFFVPVFEPLPPQYFIRVVS
1220 1230 1240 1250 1260 1270
1280 1290 1300 1310 1320 1330
pF1KB8 DRWLGAEAVCIINFQHLILPERHPPHTELLDLQPLPITALGCKAYEALYN--FSHFNPVQ
::::. :. ..:.::::::..:: ::::::::::..:: .:.:.::. : :::.:
CCDS20 DRWLSCETQLPVSFRHLILPEKYPPPTELLDLQPLPVSALRNSAFESLYQDKFPFFNPIQ
1280 1290 1300 1310 1320 1330
1340 1350 1360 1370 1380 1390
pF1KB8 TQIFHTLYHTDCNVLLGAPTGSGKTVAAELAIFRVFNKYPTSKAVYIAPLKALVRERMDD
::.:.:.:..: ::..:::::::::. ::.::.:.. . .. :::.:..::... . :
CCDS20 TQVFNTVYNSDDNVFVGAPTGSGKTICAEFAILRMLLQSSEGRCVYITPMEALAEQVYMD
1340 1350 1360 1370 1380 1390
1400 1410 1420 1430 1440 1450
pF1KB8 WKVRIEEKLGKKVIELTGDVTPDMKSIAKADLIVTTPEKWDGVSRSWQNRNYVQQVTILI
: .....:.:::. :::... :.: ..:...:..:::::: .:: :..:. ::......
CCDS20 WYEKFQDRLNKKVVLLTGETSTDLKLLGKGNIIISTPEKWDILSRRWKQRKNVQNINLFV
1400 1410 1420 1430 1440 1450
1460 1470 1480 1490 1500 1510
pF1KB8 IDEIHLLGEERGPVLEVIVSRTNFISSHTEKPVRIVGLSTALANARDLADWLNIKQMGLF
.::.::.: : ::::::: :: .:::. :.:.:::.::..:.::.:.: ::. . . :
CCDS20 VDEVHLIGGENGPVLEVICSRMRYISSQIERPIRIVALSSSLSNAKDVAHWLGCSATSTF
1460 1470 1480 1490 1500 1510
1520 1530 1540 1550 1560 1570
pF1KB8 NFRPSVRPVPLEVHIQGFPGQHYCPRMASMNKPAFQAIRSHSPAKPVLIFVSSRRQTRLT
::.:.:::::::.::::: .: :. :: ::...:: .::: :::..:: ::.:::::
CCDS20 NFHPNVRPVPLELHIQGFNISHTQTRLLSMAKPVYHAITKHSPKKPVIVFVPSRKQTRLT
1520 1530 1540 1550 1560 1570
1580 1590 1600 1610 1620 1630
pF1KB8 ALELIAFLATEEDPKQWLNMDEREMENIIATVRDSNLKLTLAFGIGMHHAGLHERDRKTV
:..... :.. . ...:. :... . . ::.:: :: :.:. : :: .:. :
CCDS20 AIDILTTCAADIQRQRFLHCTEKDLIPYLEKLSDSTLKETLLNGVGYLHEGLSPMERRLV
1580 1590 1600 1610 1620 1630
1640 1650 1660 1670 1680 1690
pF1KB8 EELFVNCKVQVLIATSTLAWGVNFPAHLVIIKGTEYYDGKTRRYVDFPITDVLQMMGRAG
:.:: . .::..:. .: ::.: :::::: :.::.:: . :::.:: :::::.:.:.
CCDS20 EQLFSSGAIQVVVASRSLCWGMNVAAHLVIIMDTQYYNGKIHAYVDYPIYDVLQMVGHAN
1640 1650 1660 1670 1680 1690
1700 1710 1720 1730 1740 1750
pF1KB8 RPQFDDQGKAVILVHDIKKDFYKKFLYEPFPVESSLLGVLSDHLNAEIAGGTITSKQDAL
:: ::.:. ::. . ::::.:::::::.:::: : . ::.::::. :: .::::.
CCDS20 RPLQDDEGRCVIMCQGSKKDFFKKFLYEPLPVESHLDHCMHDHFNAEIVTKTIENKQDAV
1700 1710 1720 1730 1740 1750
1760 1770 1780 1790 1800 1810
pF1KB8 DYITWTYFFRRLIMNPSYYNLGDVSHDSVNKFLSHLIEKSLIELELSYCIEIGEDNRSIE
::.:::...::. .::.:::: .:: .. ::.:.:..: .:: : :: : ::. ..
CCDS20 DYLTWTFLYRRMTQNPNYYNLQGISHRHLSDHLSELVEQTLSDLEQSKCISI-EDEMDVA
1760 1770 1780 1790 1800 1810
1820 1830 1840 1850 1860 1870
pF1KB8 PLTYGRIASYYYLKHQTVKMFKDRLKPECSTEELLSILSDAEEYTDLPVRHNEDHMNSEL
::. : ::.:::... :...:. :. . ... :. :.:.: :: ..:.::.::.. .:
CCDS20 PLNLGMIAAYYYINYTTIELFSMSLNAKTKVRGLIEIISNAAEYENIPIRHHEDNLLRQL
1820 1830 1840 1850 1860 1870
1880 1890 1900 1910 1920 1930
pF1KB8 AKCLPIESNPHSFDSPHTKAHLLLQAHLSRAMLPCPDYDTDTKTVLDQALRVCQAMLDVA
:. .: . : .:..::.:..::::::::: .: . ..::. .:..:.:. :: .::
CCDS20 AQKVPHKLNNPKFNDPHVKTNLLLQAHLSRMQLSA-ELQSDTEEILSKAIRLIQACVDVL
1880 1890 1900 1910 1920 1930
1940 1950 1960 1970 1980 1990
pF1KB8 ANQGWLVTVLNITNLIQMVIQGRWLKDSSLLTLPNIENHHLHLFKKWKPIMKGPHARGRT
...::: .: .: ::: :. : ::: : ::.. ..:. : .:
CCDS20 SSNGWLSPALAAMELAQMVTQAMWSKDSYLKQLPHFTSEHI----------KRCTDKGVE
1940 1950 1960 1970 1980
2000 2010 2020 2030 2040 2050
pF1KB8 SIESLPELIHACGGKDHVFSSMVESELHAAKTKQAWNFLSHLPVINVGISVKGSWDDLVE
:. .. :. .:. ..... : .. .. : .. : :
CCDS20 SVFDIMEM------EDEERNALLQ--LTDSQIADVARFCNRYPNI---------------
1990 2000 2010
2060 2070 2080 2090 2100 2110
pF1KB8 GHNELSVSTLTADKRDDNKWIKLHADQEYVLQVSLQRVHFGFHKGKPESCAVTPRFPKSK
::: .. :. ... :. :.:.: . . . ...: ::...
CCDS20 ---ELSYEVVDKDS--------IRSGGPVVVLVQLER------EEEVTGPVIAPLFPQKR
2020 2030 2040 2050 2060
2120 2130 2140 2150 2160 2170
pF1KB8 DEGWFLILGEVDKRELIALKRVGYIRNHHVASLSFYTPEIPGRYIYTLYFMSDCYLGLDQ
.:::....:.. . ::..::. .. .: .:.: .: : . :::::::: :.: ::
CCDS20 EEGWWVVIGDAKSNSLISIKRLTLQQKAKV-KLDFVAPAT-GAHNYTLYFMSDAYMGCDQ
2070 2080 2090 2100 2110
2180 2190 2200
pF1KB8 QYDIYLNVTQASLSAQVNTKVSDSLTDLALK
.: . ..: .:
CCDS20 EYKFSVDVKEAETDSDSD
2120 2130
>>CCDS75497.1 ASCC3 gene_id:10973|Hs108|chr6 (731 aa)
initn: 4671 init1: 4671 opt: 4671 Z-score: 5366.3 bits: 1005.1 E(32554): 0
Smith-Waterman score: 4671; 99.4% identity (99.7% similar) in 721 aa overlap (1-721:1-721)
10 20 30 40 50 60
pF1KB8 MALPRLTGALRSFSNVTKQDNYNEEVADLKIKRSKLHEQVLDLGLTWKKIIKFLNEKLEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 MALPRLTGALRSFSNVTKQDNYNEEVADLKIKRSKLHEQVLDLGLTWKKIIKFLNEKLEK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB8 SKMQSINEDLKDILHAAKQIVGTDNGREAIESGAAFLFMTFHLKDSVGHKETKAIKQMFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 SKMQSINEDLKDILHAAKQIVGTDNGREAIESGAAFLFMTFHLKDSVGHKETKAIKQMFG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB8 PFPSSSATAACNATNRIISHFSQDDFTALVQMTEKEHGDRVFFGKNLAFSFDMHDLDHFD
:::::::::::::::::::::::::.::::::::::::::::::::::::::::::::::
CCDS75 PFPSSSATAACNATNRIISHFSQDDLTALVQMTEKEHGDRVFFGKNLAFSFDMHDLDHFD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB8 ELPINGETQKTISLDYKKFLNEHLQEACTPELKPVEKTNGSFLWCEVEKYLNSTLKEMTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 ELPINGETQKTISLDYKKFLNEHLQEACTPELKPVEKTNGSFLWCEVEKYLNSTLKEMTE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB8 VPRVEDLCCTLYDMLASIKSGDELQDELFELLGPEGLELIEKLLQNRITIVDRFLNSSND
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 VPRVEDLCCTLYDMLASIKSGDELQDELFELLGPEGLELIEKLLQNRITIVDRFLNSSND
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB8 HRFQALQDNCKKILGENAKPNYGCQVTIQSEQEKQLMKQYRREEKRIARREKKAGEDLEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 HRFQALQDNCKKILGENAKPNYGCQVTIQSEQEKQLMKQYRREEKRIARREKKAGEDLEV
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB8 SEGLMCFDPKELRIQREQALLNARSVPILSRQRDADVEKIHYPHVYDSQAEAMKTSAFIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 SEGLMCFDPKELRIQREQALLNARSVPILSRQRDADVEKIHYPHVYDSQAEAMKTSAFIA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB8 GAKMILPEGIQRENNKLYEEVRISYSEPMPLSFEEKPVYIQDLDEIGQLAFKGMKRLNRI
::::::::::::::::::::::: ::::::::::::::::::::::::::::::::::::
CCDS75 GAKMILPEGIQRENNKLYEEVRIPYSEPMPLSFEEKPVYIQDLDEIGQLAFKGMKRLNRI
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB8 QSIVFETAYNTNENMLICAPTGAGKTNIAMLTVLHEIRQHFQQGVIKKNEFKIVYVAPMK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 QSIVFETAYNTNENMLICAPTGAGKTNIAMLTVLHEIRQHFQQGVIKKNEFKIVYVAPMK
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB8 ALAAEMTDYFSRRLEPLGIIVKELTGDMQLSKSEILRTQMLVTTPEKWDVVTRKSVGDVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 ALAAEMTDYFSRRLEPLGIIVKELTGDMQLSKSEILRTQMLVTTPEKWDVVTRKSVGDVA
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB8 LSQIVRLLILDEVHLLHEDRGPVLESIVARTLRQVESTQSMIRILGLSATLPNYLDVATF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 LSQIVRLLILDEVHLLHEDRGPVLESIVARTLRQVESTQSMIRILGLSATLPNYLDVATF
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB8 LHVNPYIGLFFFDGRFRPVPLGQTFLGIKCANKMQQLNNMDEVCYENVLKQVKAGHQVMV
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::: .
CCDS75 LHVNPYIGLFFFDGRFRPVPLGQTFLGIKCANKMQQLNNMDEVCYENVLKQVKAGHQVHL
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB8 FVHARNATVRTAMSLIERAKNCGHIPFFFSTQGHDYVLAEKQVQRSRNKQVRELFPDGFS
:
CCDS75 FYLLLHLFICF
730
>>CCDS30769.2 HFM1 gene_id:164045|Hs108|chr1 (1435 aa)
initn: 876 init1: 265 opt: 1103 Z-score: 1256.8 bits: 245.7 E(32554): 1.1e-63
Smith-Waterman score: 1148; 34.7% identity (62.7% similar) in 708 aa overlap (1310-1977:264-955)
1280 1290 1300 1310 1320 1330
pF1KB8 EAVCIINFQHLILPERHPPHTELLDLQPLPITALGCKAYEALYNFSHFNPVQTQIFHTLY
.: . : . .: .:: .:.. : :
CCDS30 GMFKAPSFSVAFQPHDIQEVTENGLGSLKAVTEIPAKFRSIFKEFPYFNYIQSKAFDDLL
240 250 260 270 280 290
1340 1350 1360 1370 1380 1390
pF1KB8 HTDCNVLLGAPTGSGKTVAAELAIFRVFNKYPTS----KAVYIAPLKALVRERMDDWKVR
.:: : .. :::::::::. :::: :.. . : : ::.::.::: .:.:::: .
CCDS30 YTDRNFVICAPTGSGKTVVFELAITRLLMEVPLPWLNIKIVYMAPIKALCSQRFDDWKEK
300 310 320 330 340 350
1400 1410 1420 1430 1440 1450
pF1KB8 IEEKLGKKVIELTGD-VTPDMKSIAKADLIVTTPEKWDGVSRSWQNRNYVQQVTILIIDE
. .: . ::::: : :. : .: .:.:::::::...:.:.. . :: : ...:::
CCDS30 FGP-IGLNCKELTGDTVMDDLFEIQHAHIIMTTPEKWDSMTRKWRDNSLVQLVRLFLIDE
360 370 380 390 400 410
1460 1470 1480 1490 1500
pF1KB8 IHLLGEE-RGPVLEVIVSRTNFISS--------HTEKPVRIVGLSTALANARDLADWLNI
.:.. .: :::.:::.::: . ..: : :.:.:..:... ::.:.:.::.
CCDS30 VHIVKDENRGPTLEVVVSRMKTVQSVSQTLKNTSTAIPMRFVAVSATIPNAEDIAEWLSD
420 430 440 450 460 470
1510 1520 1530 1540 1550 1560
pF1KB8 KQMGLFNFR--PSVRPVPLEVHIQGFP---GQHYCPRMASMNKPAFQAIRSHSPAKPVLI
. .. : ::: :. . ::: .: ..: ..:. .: ::.:.
CCDS30 GERPAVCLKMDESHRPVKLQKVVLGFPCSSNQTEFKFDLTLNYKIASVIQMYSDQKPTLV
480 490 500 510 520 530
1570 1580 1590 1600 1610
pF1KB8 FVSSRRQTRLTALELIAFLATEEDPKQWLNMDERE-MENIIATVRDSNLKLTLAFGIGMH
: ..:. .. .: :. .: : ....... ... .::::.:. : : ..:
CCDS30 FCATRKGVQQAASVLV------KDAKFIMTVEQKQRLQKYAYSVRDSKLRDILKDGAAYH
540 550 560 570 580
1620 1630 1640 1650 1660 1670
pF1KB8 HAGLHERDRKTVEELFVNCKVQVLIATSTLAWGVNFPAHLVIIKGTEYYDGKTRRYVDFP
:::.. :::.:: :. . ::..::::: :::.:::::.::.: .: : . ..
CCDS30 HAGMELSDRKVVEGAFTVGDLPVLFTTSTLAMGVNLPAHLVVIKSTMHYAGGL--FEEYS
590 600 610 620 630 640
1680 1690 1700 1710 1720 1730
pF1KB8 ITDVLQMMGRAGRPQFDDQGKAVILVHDIKKDFYKKFLYEPFPVESSLLGVLSDHLNAEI
::.:::.::::::::: . :::... .: : ..: ::::: : .::::::
CCDS30 ETDILQMIGRAGRPQFDTTATAVIMTRLSTRDKYIQMLACRDTVESSLHRHLIEHLNAEI
650 660 670 680 690 700
1740 1750 1760 1770 1780 1790
pF1KB8 AGGTITSKQDALDYITWTYFFRRLIMNPSYYNLGD-VSHDSVNKFLSHLIEKSLIELELS
. :::. . :...: : .. : . :::.:.... ...:... :..: :.: .:
CCDS30 VLHTITDVNIAVEWIRSTLLYIRALKNPSHYGFASGLNKDGIEAKLQELCLKNLNDLSSL
710 720 730 740 750 760
1800 1810 1820 1830 1840 1850
pF1KB8 YCIEIGEDNRSIEPLTYGRIASYYYLKHQTVKMFKDRLKPECSTEELLSILSDAEEYTDL
:.. : . ...: ::. ..::. .::: : .. . . .:..... .:. :.
CCDS30 DLIKMDE-GVNFKPTEAGRLMAWYYITFETVKKFYT-ISGKETLSDLVTLIAGCKEFLDI
770 780 790 800 810 820
1860 1870 1880 1890 1900
pF1KB8 PVRHNEDHMNSELAKC-------LPIESNPHSFDSPHTKAHLLLQAHLSRAMLPCPDY--
.: :: . . : : .:.:. . . . :.. :.::.:. .: :.
CCDS30 QLRINEKKTLNTLNKDPNRITIRFPMEG---RIKTREMKVNCLIQAQLG--CIPIQDFAL
830 840 850 860 870
1910 1920 1930 1940 1950 1960
pF1KB8 DTDTKTVLDQALRVCQAMLD-VAANQGWLVTVLNITNLIQMVIQGRW---LKDSSLL---
:: .. .. :. . . : :::.. ....:: : . : :. :. :
CCDS30 TQDTAKIFRHGSRITRWLSDFVAAQEKKFAVLLNSLILAKCFRCKLWENSLHVSKQLEKI
880 890 900 910 920 930
1970 1980 1990 2000 2010
pF1KB8 --TLPN-IENHHLHLFKKWKPIMKGPHARGRTSIESLPELIHACGGKDHVFSSMVESELH
:: : : : : :::
CCDS30 GITLSNAIVNAGLTSFKKIEETDARELELILNRHPPFGTQIKETVMYLPKYELKVEQITR
940 950 960 970 980 990
>>CCDS5047.1 ASCC3 gene_id:10973|Hs108|chr6 (111 aa)
initn: 501 init1: 501 opt: 501 Z-score: 584.7 bits: 117.7 E(32554): 3e-26
Smith-Waterman score: 501; 100.0% identity (100.0% similar) in 80 aa overlap (1-80:1-80)
10 20 30 40 50 60
pF1KB8 MALPRLTGALRSFSNVTKQDNYNEEVADLKIKRSKLHEQVLDLGLTWKKIIKFLNEKLEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 MALPRLTGALRSFSNVTKQDNYNEEVADLKIKRSKLHEQVLDLGLTWKKIIKFLNEKLEK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB8 SKMQSINEDLKDILHAAKQIVGTDNGREAIESGAAFLFMTFHLKDSVGHKETKAIKQMFG
::::::::::::::::::::
CCDS50 SKMQSINEDLKDILHAAKQIEVNCPFQKRRLDGKEEDEKMSRASDRFRGLR
70 80 90 100 110
2202 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 20:14:23 2016 done: Sat Nov 5 20:14:24 2016
Total Scan time: 5.460 Total Display time: 0.490
Function used was FASTA [36.3.4 Apr, 2011]