FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB8595, 2202 aa 1>>>pF1KB8595 2202 - 2202 aa - 2202 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.9218+/-0.00149; mu= 15.9986+/- 0.090 mean_var=75.5812+/-14.715, 0's: 0 Z-trim(97.8): 46 B-trim: 10 in 1/49 Lambda= 0.147526 statistics sampled from 5133 (5163) to 5133 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.48), E-opt: 0.2 (0.159), width: 16 Scan time: 5.460 The best scores are: opt bits E(32554) CCDS5046.1 ASCC3 gene_id:10973|Hs108|chr6 (2202) 14512 3099.6 0 CCDS2020.1 SNRNP200 gene_id:23020|Hs108|chr2 (2136) 5023 1080.0 0 CCDS75497.1 ASCC3 gene_id:10973|Hs108|chr6 ( 731) 4671 1005.1 0 CCDS30769.2 HFM1 gene_id:164045|Hs108|chr1 (1435) 1103 245.7 1.1e-63 CCDS5047.1 ASCC3 gene_id:10973|Hs108|chr6 ( 111) 501 117.7 3e-26 >>CCDS5046.1 ASCC3 gene_id:10973|Hs108|chr6 (2202 aa) initn: 14512 init1: 14512 opt: 14512 Z-score: 16677.1 bits: 3099.6 E(32554): 0 Smith-Waterman score: 14512; 99.9% identity (99.9% similar) in 2202 aa overlap (1-2202:1-2202) 10 20 30 40 50 60 pF1KB8 MALPRLTGALRSFSNVTKQDNYNEEVADLKIKRSKLHEQVLDLGLTWKKIIKFLNEKLEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 MALPRLTGALRSFSNVTKQDNYNEEVADLKIKRSKLHEQVLDLGLTWKKIIKFLNEKLEK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 SKMQSINEDLKDILHAAKQIVGTDNGREAIESGAAFLFMTFHLKDSVGHKETKAIKQMFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 SKMQSINEDLKDILHAAKQIVGTDNGREAIESGAAFLFMTFHLKDSVGHKETKAIKQMFG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 PFPSSSATAACNATNRIISHFSQDDFTALVQMTEKEHGDRVFFGKNLAFSFDMHDLDHFD :::::::::::::::::::::::::.:::::::::::::::::::::::::::::::::: CCDS50 PFPSSSATAACNATNRIISHFSQDDLTALVQMTEKEHGDRVFFGKNLAFSFDMHDLDHFD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 ELPINGETQKTISLDYKKFLNEHLQEACTPELKPVEKTNGSFLWCEVEKYLNSTLKEMTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 ELPINGETQKTISLDYKKFLNEHLQEACTPELKPVEKTNGSFLWCEVEKYLNSTLKEMTE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 VPRVEDLCCTLYDMLASIKSGDELQDELFELLGPEGLELIEKLLQNRITIVDRFLNSSND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 VPRVEDLCCTLYDMLASIKSGDELQDELFELLGPEGLELIEKLLQNRITIVDRFLNSSND 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB8 HRFQALQDNCKKILGENAKPNYGCQVTIQSEQEKQLMKQYRREEKRIARREKKAGEDLEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 HRFQALQDNCKKILGENAKPNYGCQVTIQSEQEKQLMKQYRREEKRIARREKKAGEDLEV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB8 SEGLMCFDPKELRIQREQALLNARSVPILSRQRDADVEKIHYPHVYDSQAEAMKTSAFIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 SEGLMCFDPKELRIQREQALLNARSVPILSRQRDADVEKIHYPHVYDSQAEAMKTSAFIA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB8 GAKMILPEGIQRENNKLYEEVRISYSEPMPLSFEEKPVYIQDLDEIGQLAFKGMKRLNRI ::::::::::::::::::::::: :::::::::::::::::::::::::::::::::::: CCDS50 GAKMILPEGIQRENNKLYEEVRIPYSEPMPLSFEEKPVYIQDLDEIGQLAFKGMKRLNRI 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB8 QSIVFETAYNTNENMLICAPTGAGKTNIAMLTVLHEIRQHFQQGVIKKNEFKIVYVAPMK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 QSIVFETAYNTNENMLICAPTGAGKTNIAMLTVLHEIRQHFQQGVIKKNEFKIVYVAPMK 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB8 ALAAEMTDYFSRRLEPLGIIVKELTGDMQLSKSEILRTQMLVTTPEKWDVVTRKSVGDVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 ALAAEMTDYFSRRLEPLGIIVKELTGDMQLSKSEILRTQMLVTTPEKWDVVTRKSVGDVA 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB8 LSQIVRLLILDEVHLLHEDRGPVLESIVARTLRQVESTQSMIRILGLSATLPNYLDVATF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 LSQIVRLLILDEVHLLHEDRGPVLESIVARTLRQVESTQSMIRILGLSATLPNYLDVATF 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB8 LHVNPYIGLFFFDGRFRPVPLGQTFLGIKCANKMQQLNNMDEVCYENVLKQVKAGHQVMV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 LHVNPYIGLFFFDGRFRPVPLGQTFLGIKCANKMQQLNNMDEVCYENVLKQVKAGHQVMV 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB8 FVHARNATVRTAMSLIERAKNCGHIPFFFSTQGHDYVLAEKQVQRSRNKQVRELFPDGFS ::::::::::::::::::::::::::::: :::::::::::::::::::::::::::::: CCDS50 FVHARNATVRTAMSLIERAKNCGHIPFFFPTQGHDYVLAEKQVQRSRNKQVRELFPDGFS 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB8 IHHAGMLRQDRNLVENLFSNGHIKVLVCTATLAWGVNLPAHAVIIKGTQIYAAKRGSFVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 IHHAGMLRQDRNLVENLFSNGHIKVLVCTATLAWGVNLPAHAVIIKGTQIYAAKRGSFVD 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB8 LGILDVMQIFGRAGRPQFDKFGEGIIITTHDKLSHYLTLLTQRNPIESQFLESLADNLNA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 LGILDVMQIFGRAGRPQFDKFGEGIIITTHDKLSHYLTLLTQRNPIESQFLESLADNLNA 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB8 EIALGTVTNVEEAVKWISYTYLYVRMRANPLAYGISHKAYQIDPTLRKHREQLVIEVGRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 EIALGTVTNVEEAVKWISYTYLYVRMRANPLAYGISHKAYQIDPTLRKHREQLVIEVGRK 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB8 LDKAQMIRFEERTGYFSSTDLGRTASHYYIKYNTIETFNELFDAHKTEGDIFAIVSKAEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 LDKAQMIRFEERTGYFSSTDLGRTASHYYIKYNTIETFNELFDAHKTEGDIFAIVSKAEE 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KB8 FDQIKVREEEIEELDTLLSNFCELSTPGGVENSYGKINILLQTYISRGEMDSFSLISDSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 FDQIKVREEEIEELDTLLSNFCELSTPGGVENSYGKINILLQTYISRGEMDSFSLISDSA 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KB8 YVAQNAARIVRALFEIALRKRWPTMTYRLLNLSKVIDKRLWGWASPLRQFSILPPHILTR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 YVAQNAARIVRALFEIALRKRWPTMTYRLLNLSKVIDKRLWGWASPLRQFSILPPHILTR 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KB8 LEEKKLTVDKLKDMRKDEIGHILHHVNIGLKVKQCVHQIPSVMMEASIQPITRTVLRVTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 LEEKKLTVDKLKDMRKDEIGHILHHVNIGLKVKQCVHQIPSVMMEASIQPITRTVLRVTL 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KB8 SIYADFTWNDQVHGTVGEPWWIWVEDPTNDHIYHSEYFLALKKQVISKEAQLLVFTIPIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 SIYADFTWNDQVHGTVGEPWWIWVEDPTNDHIYHSEYFLALKKQVISKEAQLLVFTIPIF 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KB8 EPLPSQYYIRAVSDRWLGAEAVCIINFQHLILPERHPPHTELLDLQPLPITALGCKAYEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 EPLPSQYYIRAVSDRWLGAEAVCIINFQHLILPERHPPHTELLDLQPLPITALGCKAYEA 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KB8 LYNFSHFNPVQTQIFHTLYHTDCNVLLGAPTGSGKTVAAELAIFRVFNKYPTSKAVYIAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 LYNFSHFNPVQTQIFHTLYHTDCNVLLGAPTGSGKTVAAELAIFRVFNKYPTSKAVYIAP 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KB8 LKALVRERMDDWKVRIEEKLGKKVIELTGDVTPDMKSIAKADLIVTTPEKWDGVSRSWQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 LKALVRERMDDWKVRIEEKLGKKVIELTGDVTPDMKSIAKADLIVTTPEKWDGVSRSWQN 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KB8 RNYVQQVTILIIDEIHLLGEERGPVLEVIVSRTNFISSHTEKPVRIVGLSTALANARDLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 RNYVQQVTILIIDEIHLLGEERGPVLEVIVSRTNFISSHTEKPVRIVGLSTALANARDLA 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KB8 DWLNIKQMGLFNFRPSVRPVPLEVHIQGFPGQHYCPRMASMNKPAFQAIRSHSPAKPVLI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 DWLNIKQMGLFNFRPSVRPVPLEVHIQGFPGQHYCPRMASMNKPAFQAIRSHSPAKPVLI 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KB8 FVSSRRQTRLTALELIAFLATEEDPKQWLNMDEREMENIIATVRDSNLKLTLAFGIGMHH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 FVSSRRQTRLTALELIAFLATEEDPKQWLNMDEREMENIIATVRDSNLKLTLAFGIGMHH 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KB8 AGLHERDRKTVEELFVNCKVQVLIATSTLAWGVNFPAHLVIIKGTEYYDGKTRRYVDFPI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 AGLHERDRKTVEELFVNCKVQVLIATSTLAWGVNFPAHLVIIKGTEYYDGKTRRYVDFPI 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KB8 TDVLQMMGRAGRPQFDDQGKAVILVHDIKKDFYKKFLYEPFPVESSLLGVLSDHLNAEIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 TDVLQMMGRAGRPQFDDQGKAVILVHDIKKDFYKKFLYEPFPVESSLLGVLSDHLNAEIA 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KB8 GGTITSKQDALDYITWTYFFRRLIMNPSYYNLGDVSHDSVNKFLSHLIEKSLIELELSYC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 GGTITSKQDALDYITWTYFFRRLIMNPSYYNLGDVSHDSVNKFLSHLIEKSLIELELSYC 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KB8 IEIGEDNRSIEPLTYGRIASYYYLKHQTVKMFKDRLKPECSTEELLSILSDAEEYTDLPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 IEIGEDNRSIEPLTYGRIASYYYLKHQTVKMFKDRLKPECSTEELLSILSDAEEYTDLPV 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KB8 RHNEDHMNSELAKCLPIESNPHSFDSPHTKAHLLLQAHLSRAMLPCPDYDTDTKTVLDQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 RHNEDHMNSELAKCLPIESNPHSFDSPHTKAHLLLQAHLSRAMLPCPDYDTDTKTVLDQA 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KB8 LRVCQAMLDVAANQGWLVTVLNITNLIQMVIQGRWLKDSSLLTLPNIENHHLHLFKKWKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 LRVCQAMLDVAANQGWLVTVLNITNLIQMVIQGRWLKDSSLLTLPNIENHHLHLFKKWKP 1930 1940 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 pF1KB8 IMKGPHARGRTSIESLPELIHACGGKDHVFSSMVESELHAAKTKQAWNFLSHLPVINVGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 IMKGPHARGRTSIESLPELIHACGGKDHVFSSMVESELHAAKTKQAWNFLSHLPVINVGI 1990 2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 2100 pF1KB8 SVKGSWDDLVEGHNELSVSTLTADKRDDNKWIKLHADQEYVLQVSLQRVHFGFHKGKPES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 SVKGSWDDLVEGHNELSVSTLTADKRDDNKWIKLHADQEYVLQVSLQRVHFGFHKGKPES 2050 2060 2070 2080 2090 2100 2110 2120 2130 2140 2150 2160 pF1KB8 CAVTPRFPKSKDEGWFLILGEVDKRELIALKRVGYIRNHHVASLSFYTPEIPGRYIYTLY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 CAVTPRFPKSKDEGWFLILGEVDKRELIALKRVGYIRNHHVASLSFYTPEIPGRYIYTLY 2110 2120 2130 2140 2150 2160 2170 2180 2190 2200 pF1KB8 FMSDCYLGLDQQYDIYLNVTQASLSAQVNTKVSDSLTDLALK :::::::::::::::::::::::::::::::::::::::::: CCDS50 FMSDCYLGLDQQYDIYLNVTQASLSAQVNTKVSDSLTDLALK 2170 2180 2190 2200 >>CCDS2020.1 SNRNP200 gene_id:23020|Hs108|chr2 (2136 aa) initn: 4450 init1: 1694 opt: 5023 Z-score: 5762.6 bits: 1080.0 E(32554): 0 Smith-Waterman score: 5176; 40.2% identity (70.2% similar) in 2141 aa overlap (60-2182:103-2129) 30 40 50 60 70 80 pF1KB8 KIKRSKLHEQVLDLGLTWKKIIKFLNEKLEKSKMQSINEDLKDILHAAKQIVGTDNGREA : : . : . .: . .: :. :. CCDS20 KRDEDRHDINKMKGYTLLSEGIDEMVGIIYKPKTKETRETYEVLLSFIQAALG-DQPRD- 80 90 100 110 120 130 90 100 110 120 130 140 pF1KB8 IESGAAFLFMTFHLKDSVGHKET-KAIKQMFGPFPSSSATAACNATNRIISHFSQDDFTA : ::: .. .... :: : : ..: .. . : ..: .. .. .. CCDS20 ILCGAADEVLAVLKNEKLRDKERRKEIDLLLGQTDDTRYHVLVNLGKKITDYGGDKEIQN 140 150 160 170 180 190 150 160 170 180 190 200 pF1KB8 LVQMTEKEHGDRVFFGKNLAFSFDMHDLDHFDELPINGETQKTISLD--------YKKFL . .. :... : :. : : .. :. . ::... : : . : CCDS20 M-----DDNIDETY-GVNVQFESDEEEGDE----DVYGEVREEASDDDMEGDEAVVRCTL 200 210 220 230 240 210 220 230 240 250 pF1KB8 NEHL---QEACTPELKPVEKTNGSFLWCEVEKYLNSTLKEMTEVPRVEDLCCTLYDMLAS . .: : . . : .. . . .: ... :. . . : . ..: . CCDS20 SANLVASGELMSSKKKDLHPRDIDAFW--LQRQLSRFYDDAIVSQKKAD---EVLEILKT 250 260 270 280 290 260 270 280 290 300 310 pF1KB8 IKSGDELQDELFELLGPEGLELIEKLLQNRITIVDRFLNSSNDHRFQALQDNCKKILGE- .. : ...: ::: . ...:. : :.:. :. : .: . . . ..:.:. CCDS20 ASDDRECENQLVLLLGFNTFDFIKVLRQHRMMILYCTLLASAQSEAEK-----ERIMGKM 300 310 320 330 340 350 320 330 340 350 360 370 pF1KB8 NAKPNYGCQVTIQSEQEKQ-LMKQYRREEKRIARREKKAGEDLEVSEGLMCFDPKELRIQ .: :. . . : ::. :... : ...:. :... :::. : .: : CCDS20 EADPELSKFLYQLHETEKEDLIREERSRRERV--RQSRMDTDLET----MDLD------Q 360 370 380 390 380 390 400 410 420 430 pF1KB8 REQALLNARSVPILSRQRDADVEKIHYPHVYDSQAEAMKTSAFIAGAKMILPEGIQRENN .:: .: :: :.: . . . : :.:. . ::.: :.. CCDS20 GGEAL-----AP---RQV-LDLEDLVFT----------QGSHFMANKRCQLPDGSFRRQR 400 410 420 430 440 450 460 470 480 490 pF1KB8 KLYEEVRISYSEPMPLSFEEKPVYIQDLDEIGQLAFKGMKRLNRIQSIVFETAYNTNENM : ::::.. .: :.. ::. . .. : . .: .:.:.: :::::: ....: .:.::. CCDS20 KGYEEVHVPALKPKPFGSEEQLLPVEKLPKYAQAGFEGFKTLNRIQSKLYRAALETDENL 440 450 460 470 480 490 500 510 520 530 540 550 pF1KB8 LICAPTGAGKTNIAMLTVLHEIRQHFQQ-GVIKKNEFKIVYVAPMKALAAEMTDYFSRRL :.::::::::::.:.. .:.:: .:... :.:. ..:::.:.:::..:. ::. :..:: CCDS20 LLCAPTGAGKTNVALMCMLREIGKHINMDGTINVDDFKIIYIAPMRSLVQEMVGSFGKRL 500 510 520 530 540 550 560 570 580 590 600 610 pF1KB8 EPLGIIVKELTGDMQLSKSEILRTQMLVTTPEKWDVVTRKSVGDVALSQIVRLLILDEVH :: : ::::: :: : :: ::..: ::::::..:::. :. . .:.:::.::::.: CCDS20 ATYGITVAELTGDHQLCKEEISATQIIVCTPEKWDIITRKG-GERTYTQLVRLIILDEIH 560 570 580 590 600 610 620 630 640 650 660 670 pF1KB8 LLHEDRGPVLESIVARTLRQVESTQSMIRILGLSATLPNYLDVATFLHVNPYIGLFFFDG :::.:::::::..:::..:..: :: .:..::::::::: ::::::.:.: :::.::. CCDS20 LLHDDRGPVLEALVARAIRNIEMTQEDVRLIGLSATLPNYEDVATFLRVDPAKGLFYFDN 620 630 640 650 660 670 680 690 700 710 720 730 pF1KB8 RFRPVPLGQTFLGIKCANKMQQLNNMDEVCYENVLKQVKAG-HQVMVFVHARNATVRTAM :::::: ::..:: . ..... :.:. ::..... :: .::.::::.:. : .:: CCDS20 SFRPVPLEQTYVGITEKKAIKRFQIMNEIVYEKIMEH--AGKNQVLVFVHSRKETGKTAR 680 690 700 710 720 730 740 750 760 770 780 790 pF1KB8 SLIERAKNCGHIPFFFSTQGHDYVLAEKQVQRSRNKQVRELFPDGFSIHHAGMLRQDRNL .. . . . .:. . . . . .... .: ....:.: ::.:::::: : ::.: CCDS20 AIRDMCLEKDTLGLFLREGSASTEVLRTEAEQCKNLELKDLLPYGFAIHHAGMTRVDRTL 740 750 760 770 780 790 800 810 820 830 840 850 pF1KB8 VENLFSNGHIKVLVCTATLAWGVNLPAHAVIIKGTQIYAAKRGSFVDLGILDVMQIFGRA ::.::.. ::.::: :::::::::::::.:::::::.:. ..: ...:: ::..:..::: CCDS20 VEDLFADKHIQVLVSTATLAWGVNLPAHTVIIKGTQVYSPEKGRWTELGALDILQMLGRA 800 810 820 830 840 850 860 870 880 890 900 910 pF1KB8 GRPQFDKFGEGIIITTHDKLSHYLTLLTQRNPIESQFLESLADNLNAEIALGTVTNVEEA ::::.: ::::.::.: .:..::.::.:. :::::.. .: : :::::.::.: :...: CCDS20 GRPQYDTKGEGILITSHGELQYYLSLLNQQLPIESQMVSKLPDMLNAEIVLGNVQNAKDA 860 870 880 890 900 910 920 930 940 950 960 970 pF1KB8 VKWISYTYLYVRMRANPLAYGISHKAYQIDPTLRKHREQLVIEVGRKLDKAQMIRFEERT :.:..:.:::.:: .: ::::: . :: : ..: .:: .. ::: ........: CCDS20 VNWLGYAYLYIRMLRSPTLYGISHDDLKGDPLLDQRRLDLVHTAALMLDKNNLVKYDKKT 920 930 940 950 960 970 980 990 1000 1010 1020 1030 pF1KB8 GYFSSTDLGRTASHYYIKYNTIETFNELFDAHKTEGDIFAIVSKAEEFDQIKVREEEIEE : :. :.::: :::::: .:..:.:.:. .: ..: . : . :: .: ::::: : CCDS20 GNFQVTELGRIASHYYITNDTVQTYNQLLKPTLSEIELFRVFSLSSEFKNITVREEEKLE 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 1090 pF1KB8 LDTLLSNFCELSTPGGVENSYGKINILLQTYISRGEMDSFSLISDSAYVAQNAARIVRAL :. :: . . ..:. .:::.:::..::. ....:.:..: .::.:.:.:..::. CCDS20 LQKLLERV-PIPVKESIEEPSAKINVLLQAFISQLKLEGFALMADMVYVTQSAGRLMRAI 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 1150 pF1KB8 FEIALRKRWPTMTYRLLNLSKVIDKRLWGWASPLRQFSILPPHILTRLEEKKLTVDKLKD :::.: . : .: . ::: :.::::.: ::::: :: ... ..:.:.. ..: : CCDS20 FEIVLNRGWAQLTDKTLNLCKMIDKRMWQSMCPLRQFRKLPEEVVKKIEKKNFPFERLYD 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 1210 pF1KB8 MRKDEIGHILHHVNIGLKVKQCVHQIPSVMMEASIQPITRTVLRVTLSIYADFTWNDQVH . ..:::.... ..: ... :: .:.. . . .:::::..:.: :.: :: :...:: CCDS20 LNHNEIGELIRMPKMGKTIHKYVHLFPKLELSVHLQPITRSTLKVELTITPDFQWDEKVH 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 1270 pF1KB8 GTVGEPWWIWVEDPTNDHIYHSEYFLALKKQVISKEAQLLVFTIPIFEPLPSQYYIRAVS :. .: .:: ::: .. : : :::: :: . ... .:..: .:.::::: ::.::.:: CCDS20 GS-SEAFWILVEDVDSEVILHHEYFL-LKAKY-AQDEHLITFFVPVFEPLPPQYFIRVVS 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 1330 pF1KB8 DRWLGAEAVCIINFQHLILPERHPPHTELLDLQPLPITALGCKAYEALYN--FSHFNPVQ ::::. :. ..:.::::::..:: ::::::::::..:: .:.:.::. : :::.: CCDS20 DRWLSCETQLPVSFRHLILPEKYPPPTELLDLQPLPVSALRNSAFESLYQDKFPFFNPIQ 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 1390 pF1KB8 TQIFHTLYHTDCNVLLGAPTGSGKTVAAELAIFRVFNKYPTSKAVYIAPLKALVRERMDD ::.:.:.:..: ::..:::::::::. ::.::.:.. . .. :::.:..::... . : CCDS20 TQVFNTVYNSDDNVFVGAPTGSGKTICAEFAILRMLLQSSEGRCVYITPMEALAEQVYMD 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 1450 pF1KB8 WKVRIEEKLGKKVIELTGDVTPDMKSIAKADLIVTTPEKWDGVSRSWQNRNYVQQVTILI : .....:.:::. :::... :.: ..:...:..:::::: .:: :..:. ::...... CCDS20 WYEKFQDRLNKKVVLLTGETSTDLKLLGKGNIIISTPEKWDILSRRWKQRKNVQNINLFV 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 1510 pF1KB8 IDEIHLLGEERGPVLEVIVSRTNFISSHTEKPVRIVGLSTALANARDLADWLNIKQMGLF .::.::.: : ::::::: :: .:::. :.:.:::.::..:.::.:.: ::. . . : CCDS20 VDEVHLIGGENGPVLEVICSRMRYISSQIERPIRIVALSSSLSNAKDVAHWLGCSATSTF 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 1570 pF1KB8 NFRPSVRPVPLEVHIQGFPGQHYCPRMASMNKPAFQAIRSHSPAKPVLIFVSSRRQTRLT ::.:.:::::::.::::: .: :. :: ::...:: .::: :::..:: ::.::::: CCDS20 NFHPNVRPVPLELHIQGFNISHTQTRLLSMAKPVYHAITKHSPKKPVIVFVPSRKQTRLT 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 1630 pF1KB8 ALELIAFLATEEDPKQWLNMDEREMENIIATVRDSNLKLTLAFGIGMHHAGLHERDRKTV :..... :.. . ...:. :... . . ::.:: :: :.:. : :: .:. : CCDS20 AIDILTTCAADIQRQRFLHCTEKDLIPYLEKLSDSTLKETLLNGVGYLHEGLSPMERRLV 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 1690 pF1KB8 EELFVNCKVQVLIATSTLAWGVNFPAHLVIIKGTEYYDGKTRRYVDFPITDVLQMMGRAG :.:: . .::..:. .: ::.: :::::: :.::.:: . :::.:: :::::.:.:. CCDS20 EQLFSSGAIQVVVASRSLCWGMNVAAHLVIIMDTQYYNGKIHAYVDYPIYDVLQMVGHAN 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 1750 pF1KB8 RPQFDDQGKAVILVHDIKKDFYKKFLYEPFPVESSLLGVLSDHLNAEIAGGTITSKQDAL :: ::.:. ::. . ::::.:::::::.:::: : . ::.::::. :: .::::. CCDS20 RPLQDDEGRCVIMCQGSKKDFFKKFLYEPLPVESHLDHCMHDHFNAEIVTKTIENKQDAV 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 1810 pF1KB8 DYITWTYFFRRLIMNPSYYNLGDVSHDSVNKFLSHLIEKSLIELELSYCIEIGEDNRSIE ::.:::...::. .::.:::: .:: .. ::.:.:..: .:: : :: : ::. .. CCDS20 DYLTWTFLYRRMTQNPNYYNLQGISHRHLSDHLSELVEQTLSDLEQSKCISI-EDEMDVA 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 1870 pF1KB8 PLTYGRIASYYYLKHQTVKMFKDRLKPECSTEELLSILSDAEEYTDLPVRHNEDHMNSEL ::. : ::.:::... :...:. :. . ... :. :.:.: :: ..:.::.::.. .: CCDS20 PLNLGMIAAYYYINYTTIELFSMSLNAKTKVRGLIEIISNAAEYENIPIRHHEDNLLRQL 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 1930 pF1KB8 AKCLPIESNPHSFDSPHTKAHLLLQAHLSRAMLPCPDYDTDTKTVLDQALRVCQAMLDVA :. .: . : .:..::.:..::::::::: .: . ..::. .:..:.:. :: .:: CCDS20 AQKVPHKLNNPKFNDPHVKTNLLLQAHLSRMQLSA-ELQSDTEEILSKAIRLIQACVDVL 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 1990 pF1KB8 ANQGWLVTVLNITNLIQMVIQGRWLKDSSLLTLPNIENHHLHLFKKWKPIMKGPHARGRT ...::: .: .: ::: :. : ::: : ::.. ..:. : .: CCDS20 SSNGWLSPALAAMELAQMVTQAMWSKDSYLKQLPHFTSEHI----------KRCTDKGVE 1940 1950 1960 1970 1980 2000 2010 2020 2030 2040 2050 pF1KB8 SIESLPELIHACGGKDHVFSSMVESELHAAKTKQAWNFLSHLPVINVGISVKGSWDDLVE :. .. :. .:. ..... : .. .. : .. : : CCDS20 SVFDIMEM------EDEERNALLQ--LTDSQIADVARFCNRYPNI--------------- 1990 2000 2010 2060 2070 2080 2090 2100 2110 pF1KB8 GHNELSVSTLTADKRDDNKWIKLHADQEYVLQVSLQRVHFGFHKGKPESCAVTPRFPKSK ::: .. :. ... :. :.:.: . . . ...: ::... CCDS20 ---ELSYEVVDKDS--------IRSGGPVVVLVQLER------EEEVTGPVIAPLFPQKR 2020 2030 2040 2050 2060 2120 2130 2140 2150 2160 2170 pF1KB8 DEGWFLILGEVDKRELIALKRVGYIRNHHVASLSFYTPEIPGRYIYTLYFMSDCYLGLDQ .:::....:.. . ::..::. .. .: .:.: .: : . :::::::: :.: :: CCDS20 EEGWWVVIGDAKSNSLISIKRLTLQQKAKV-KLDFVAPAT-GAHNYTLYFMSDAYMGCDQ 2070 2080 2090 2100 2110 2180 2190 2200 pF1KB8 QYDIYLNVTQASLSAQVNTKVSDSLTDLALK .: . ..: .: CCDS20 EYKFSVDVKEAETDSDSD 2120 2130 >>CCDS75497.1 ASCC3 gene_id:10973|Hs108|chr6 (731 aa) initn: 4671 init1: 4671 opt: 4671 Z-score: 5366.3 bits: 1005.1 E(32554): 0 Smith-Waterman score: 4671; 99.4% identity (99.7% similar) in 721 aa overlap (1-721:1-721) 10 20 30 40 50 60 pF1KB8 MALPRLTGALRSFSNVTKQDNYNEEVADLKIKRSKLHEQVLDLGLTWKKIIKFLNEKLEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 MALPRLTGALRSFSNVTKQDNYNEEVADLKIKRSKLHEQVLDLGLTWKKIIKFLNEKLEK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 SKMQSINEDLKDILHAAKQIVGTDNGREAIESGAAFLFMTFHLKDSVGHKETKAIKQMFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 SKMQSINEDLKDILHAAKQIVGTDNGREAIESGAAFLFMTFHLKDSVGHKETKAIKQMFG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 PFPSSSATAACNATNRIISHFSQDDFTALVQMTEKEHGDRVFFGKNLAFSFDMHDLDHFD :::::::::::::::::::::::::.:::::::::::::::::::::::::::::::::: CCDS75 PFPSSSATAACNATNRIISHFSQDDLTALVQMTEKEHGDRVFFGKNLAFSFDMHDLDHFD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 ELPINGETQKTISLDYKKFLNEHLQEACTPELKPVEKTNGSFLWCEVEKYLNSTLKEMTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 ELPINGETQKTISLDYKKFLNEHLQEACTPELKPVEKTNGSFLWCEVEKYLNSTLKEMTE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 VPRVEDLCCTLYDMLASIKSGDELQDELFELLGPEGLELIEKLLQNRITIVDRFLNSSND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 VPRVEDLCCTLYDMLASIKSGDELQDELFELLGPEGLELIEKLLQNRITIVDRFLNSSND 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB8 HRFQALQDNCKKILGENAKPNYGCQVTIQSEQEKQLMKQYRREEKRIARREKKAGEDLEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 HRFQALQDNCKKILGENAKPNYGCQVTIQSEQEKQLMKQYRREEKRIARREKKAGEDLEV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB8 SEGLMCFDPKELRIQREQALLNARSVPILSRQRDADVEKIHYPHVYDSQAEAMKTSAFIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 SEGLMCFDPKELRIQREQALLNARSVPILSRQRDADVEKIHYPHVYDSQAEAMKTSAFIA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB8 GAKMILPEGIQRENNKLYEEVRISYSEPMPLSFEEKPVYIQDLDEIGQLAFKGMKRLNRI ::::::::::::::::::::::: :::::::::::::::::::::::::::::::::::: CCDS75 GAKMILPEGIQRENNKLYEEVRIPYSEPMPLSFEEKPVYIQDLDEIGQLAFKGMKRLNRI 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB8 QSIVFETAYNTNENMLICAPTGAGKTNIAMLTVLHEIRQHFQQGVIKKNEFKIVYVAPMK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 QSIVFETAYNTNENMLICAPTGAGKTNIAMLTVLHEIRQHFQQGVIKKNEFKIVYVAPMK 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB8 ALAAEMTDYFSRRLEPLGIIVKELTGDMQLSKSEILRTQMLVTTPEKWDVVTRKSVGDVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 ALAAEMTDYFSRRLEPLGIIVKELTGDMQLSKSEILRTQMLVTTPEKWDVVTRKSVGDVA 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB8 LSQIVRLLILDEVHLLHEDRGPVLESIVARTLRQVESTQSMIRILGLSATLPNYLDVATF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 LSQIVRLLILDEVHLLHEDRGPVLESIVARTLRQVESTQSMIRILGLSATLPNYLDVATF 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB8 LHVNPYIGLFFFDGRFRPVPLGQTFLGIKCANKMQQLNNMDEVCYENVLKQVKAGHQVMV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: . CCDS75 LHVNPYIGLFFFDGRFRPVPLGQTFLGIKCANKMQQLNNMDEVCYENVLKQVKAGHQVHL 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB8 FVHARNATVRTAMSLIERAKNCGHIPFFFSTQGHDYVLAEKQVQRSRNKQVRELFPDGFS : CCDS75 FYLLLHLFICF 730 >>CCDS30769.2 HFM1 gene_id:164045|Hs108|chr1 (1435 aa) initn: 876 init1: 265 opt: 1103 Z-score: 1256.8 bits: 245.7 E(32554): 1.1e-63 Smith-Waterman score: 1148; 34.7% identity (62.7% similar) in 708 aa overlap (1310-1977:264-955) 1280 1290 1300 1310 1320 1330 pF1KB8 EAVCIINFQHLILPERHPPHTELLDLQPLPITALGCKAYEALYNFSHFNPVQTQIFHTLY .: . : . .: .:: .:.. : : CCDS30 GMFKAPSFSVAFQPHDIQEVTENGLGSLKAVTEIPAKFRSIFKEFPYFNYIQSKAFDDLL 240 250 260 270 280 290 1340 1350 1360 1370 1380 1390 pF1KB8 HTDCNVLLGAPTGSGKTVAAELAIFRVFNKYPTS----KAVYIAPLKALVRERMDDWKVR .:: : .. :::::::::. :::: :.. . : : ::.::.::: .:.:::: . CCDS30 YTDRNFVICAPTGSGKTVVFELAITRLLMEVPLPWLNIKIVYMAPIKALCSQRFDDWKEK 300 310 320 330 340 350 1400 1410 1420 1430 1440 1450 pF1KB8 IEEKLGKKVIELTGD-VTPDMKSIAKADLIVTTPEKWDGVSRSWQNRNYVQQVTILIIDE . .: . ::::: : :. : .: .:.:::::::...:.:.. . :: : ...::: CCDS30 FGP-IGLNCKELTGDTVMDDLFEIQHAHIIMTTPEKWDSMTRKWRDNSLVQLVRLFLIDE 360 370 380 390 400 410 1460 1470 1480 1490 1500 pF1KB8 IHLLGEE-RGPVLEVIVSRTNFISS--------HTEKPVRIVGLSTALANARDLADWLNI .:.. .: :::.:::.::: . ..: : :.:.:..:... ::.:.:.::. CCDS30 VHIVKDENRGPTLEVVVSRMKTVQSVSQTLKNTSTAIPMRFVAVSATIPNAEDIAEWLSD 420 430 440 450 460 470 1510 1520 1530 1540 1550 1560 pF1KB8 KQMGLFNFR--PSVRPVPLEVHIQGFP---GQHYCPRMASMNKPAFQAIRSHSPAKPVLI . .. : ::: :. . ::: .: ..: ..:. .: ::.:. CCDS30 GERPAVCLKMDESHRPVKLQKVVLGFPCSSNQTEFKFDLTLNYKIASVIQMYSDQKPTLV 480 490 500 510 520 530 1570 1580 1590 1600 1610 pF1KB8 FVSSRRQTRLTALELIAFLATEEDPKQWLNMDERE-MENIIATVRDSNLKLTLAFGIGMH : ..:. .. .: :. .: : ....... ... .::::.:. : : ..: CCDS30 FCATRKGVQQAASVLV------KDAKFIMTVEQKQRLQKYAYSVRDSKLRDILKDGAAYH 540 550 560 570 580 1620 1630 1640 1650 1660 1670 pF1KB8 HAGLHERDRKTVEELFVNCKVQVLIATSTLAWGVNFPAHLVIIKGTEYYDGKTRRYVDFP :::.. :::.:: :. . ::..::::: :::.:::::.::.: .: : . .. CCDS30 HAGMELSDRKVVEGAFTVGDLPVLFTTSTLAMGVNLPAHLVVIKSTMHYAGGL--FEEYS 590 600 610 620 630 640 1680 1690 1700 1710 1720 1730 pF1KB8 ITDVLQMMGRAGRPQFDDQGKAVILVHDIKKDFYKKFLYEPFPVESSLLGVLSDHLNAEI ::.:::.::::::::: . :::... .: : ..: ::::: : .:::::: CCDS30 ETDILQMIGRAGRPQFDTTATAVIMTRLSTRDKYIQMLACRDTVESSLHRHLIEHLNAEI 650 660 670 680 690 700 1740 1750 1760 1770 1780 1790 pF1KB8 AGGTITSKQDALDYITWTYFFRRLIMNPSYYNLGD-VSHDSVNKFLSHLIEKSLIELELS . :::. . :...: : .. : . :::.:.... ...:... :..: :.: .: CCDS30 VLHTITDVNIAVEWIRSTLLYIRALKNPSHYGFASGLNKDGIEAKLQELCLKNLNDLSSL 710 720 730 740 750 760 1800 1810 1820 1830 1840 1850 pF1KB8 YCIEIGEDNRSIEPLTYGRIASYYYLKHQTVKMFKDRLKPECSTEELLSILSDAEEYTDL :.. : . ...: ::. ..::. .::: : .. . . .:..... .:. :. CCDS30 DLIKMDE-GVNFKPTEAGRLMAWYYITFETVKKFYT-ISGKETLSDLVTLIAGCKEFLDI 770 780 790 800 810 820 1860 1870 1880 1890 1900 pF1KB8 PVRHNEDHMNSELAKC-------LPIESNPHSFDSPHTKAHLLLQAHLSRAMLPCPDY-- .: :: . . : : .:.:. . . . :.. :.::.:. .: :. CCDS30 QLRINEKKTLNTLNKDPNRITIRFPMEG---RIKTREMKVNCLIQAQLG--CIPIQDFAL 830 840 850 860 870 1910 1920 1930 1940 1950 1960 pF1KB8 DTDTKTVLDQALRVCQAMLD-VAANQGWLVTVLNITNLIQMVIQGRW---LKDSSLL--- :: .. .. :. . . : :::.. ....:: : . : :. :. : CCDS30 TQDTAKIFRHGSRITRWLSDFVAAQEKKFAVLLNSLILAKCFRCKLWENSLHVSKQLEKI 880 890 900 910 920 930 1970 1980 1990 2000 2010 pF1KB8 --TLPN-IENHHLHLFKKWKPIMKGPHARGRTSIESLPELIHACGGKDHVFSSMVESELH :: : : : : ::: CCDS30 GITLSNAIVNAGLTSFKKIEETDARELELILNRHPPFGTQIKETVMYLPKYELKVEQITR 940 950 960 970 980 990 >>CCDS5047.1 ASCC3 gene_id:10973|Hs108|chr6 (111 aa) initn: 501 init1: 501 opt: 501 Z-score: 584.7 bits: 117.7 E(32554): 3e-26 Smith-Waterman score: 501; 100.0% identity (100.0% similar) in 80 aa overlap (1-80:1-80) 10 20 30 40 50 60 pF1KB8 MALPRLTGALRSFSNVTKQDNYNEEVADLKIKRSKLHEQVLDLGLTWKKIIKFLNEKLEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS50 MALPRLTGALRSFSNVTKQDNYNEEVADLKIKRSKLHEQVLDLGLTWKKIIKFLNEKLEK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 SKMQSINEDLKDILHAAKQIVGTDNGREAIESGAAFLFMTFHLKDSVGHKETKAIKQMFG :::::::::::::::::::: CCDS50 SKMQSINEDLKDILHAAKQIEVNCPFQKRRLDGKEEDEKMSRASDRFRGLR 70 80 90 100 110 2202 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 20:14:23 2016 done: Sat Nov 5 20:14:24 2016 Total Scan time: 5.460 Total Display time: 0.490 Function used was FASTA [36.3.4 Apr, 2011]