FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1031, 977 aa 1>>>pF1KA1031 977 - 977 aa - 977 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.4652+/-0.000963; mu= 7.2988+/- 0.058 mean_var=175.6239+/-35.488, 0's: 0 Z-trim(111.0): 25 B-trim: 6 in 1/51 Lambda= 0.096779 statistics sampled from 12055 (12074) to 12055 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.714), E-opt: 0.2 (0.371), width: 16 Scan time: 4.350 The best scores are: opt bits E(32554) CCDS14013.1 ZC3H7B gene_id:23264|Hs108|chr22 ( 977) 6755 956.1 0 CCDS10550.1 ZC3H7A gene_id:29066|Hs108|chr16 ( 971) 2949 424.7 4.3e-118 >>CCDS14013.1 ZC3H7B gene_id:23264|Hs108|chr22 (977 aa) initn: 6755 init1: 6755 opt: 6755 Z-score: 5105.5 bits: 956.1 E(32554): 0 Smith-Waterman score: 6755; 100.0% identity (100.0% similar) in 977 aa overlap (1-977:1-977) 10 20 30 40 50 60 pF1KA1 MERQKRKADIEKGLQFIQSTLPLKQEEYEAFLLKLVQNLFAEGNDLFREKDYKQALVQYM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MERQKRKADIEKGLQFIQSTLPLKQEEYEAFLLKLVQNLFAEGNDLFREKDYKQALVQYM 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 EGLNVADYAASDQVALPRELLCKLHVNRAACYFTMGLYEKALEDSEKALGLDSESIRALF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 EGLNVADYAASDQVALPRELLCKLHVNRAACYFTMGLYEKALEDSEKALGLDSESIRALF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 RKARALNELGRHKEAYECSSRCSLALPHDESVTQLGQELAQKLGLRVRKAYKRPQELETF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 RKARALNELGRHKEAYECSSRCSLALPHDESVTQLGQELAQKLGLRVRKAYKRPQELETF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA1 SLLSNGTAAGVADQGTSNGLGSIDDIETDCYVDPRGSPALLPSTPTMPLFPHVLDLLAPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 SLLSNGTAAGVADQGTSNGLGSIDDIETDCYVDPRGSPALLPSTPTMPLFPHVLDLLAPL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA1 DSSRTLPSTDSLDDFSDGDVFGPELDTLLDSLSLVQGGLSGSGVPSELPQLIPVFPGGTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 DSSRTLPSTDSLDDFSDGDVFGPELDTLLDSLSLVQGGLSGSGVPSELPQLIPVFPGGTP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA1 LLPPVVGGSIPVSSPLPPASFGLVMDPSKKLAASVLDALDPPGPTLDPLDLLPYSETRLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 LLPPVVGGSIPVSSPLPPASFGLVMDPSKKLAASVLDALDPPGPTLDPLDLLPYSETRLD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA1 ALDSFGSTRGSLDKPDSFMEETNSQDHRPPSGAQKPAPSPEPCMPNTALLIKNPLAATHE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 ALDSFGSTRGSLDKPDSFMEETNSQDHRPPSGAQKPAPSPEPCMPNTALLIKNPLAATHE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA1 FKQACQLCYPKTGPRAGDYTYREGLEHKCKRDILLGRLRSSEDQTWKRIRPRPTKTSFVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 FKQACQLCYPKTGPRAGDYTYREGLEHKCKRDILLGRLRSSEDQTWKRIRPRPTKTSFVG 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA1 SYYLCKDMINKQDCKYGDNCTFAYHQEEIDVWTEERKGTLNRDLLFDPLGGVKRGSLTIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 SYYLCKDMINKQDCKYGDNCTFAYHQEEIDVWTEERKGTLNRDLLFDPLGGVKRGSLTIA 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA1 KLLKEHQGIFTFLCEICFDSKPRIISKGTKDSPSVCSNLAAKHSFYNNKCLVHIVRSTSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 KLLKEHQGIFTFLCEICFDSKPRIISKGTKDSPSVCSNLAAKHSFYNNKCLVHIVRSTSL 550 560 570 580 590 600 610 620 630 640 650 660 pF1KA1 KYSKIRQFQEHFQFDVCRHEVRYGCLREDSCHFAHSFIELKVWLLQQYSGMTHEDIVQES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 KYSKIRQFQEHFQFDVCRHEVRYGCLREDSCHFAHSFIELKVWLLQQYSGMTHEDIVQES 610 620 630 640 650 660 670 680 690 700 710 720 pF1KA1 KKYWQQMEAHAGKASSSMGAPRTHGPSTFDLQMKFVCGQCWRNGQVVEPDKDLKYCSAKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 KKYWQQMEAHAGKASSSMGAPRTHGPSTFDLQMKFVCGQCWRNGQVVEPDKDLKYCSAKA 670 680 690 700 710 720 730 740 750 760 770 780 pF1KA1 RHCWTKERRVLLVMSKAKRKWVSVRPLPSIRNFPQQYDLCIHAQNGRKCQYVGNCSFAHS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 RHCWTKERRVLLVMSKAKRKWVSVRPLPSIRNFPQQYDLCIHAQNGRKCQYVGNCSFAHS 730 740 750 760 770 780 790 800 810 820 830 840 pF1KA1 PEERDMWTFMKENKILDMQQTYDMWLKKHNPGKPGEGTPISSREGEKQIQMPTDYADIMM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 PEERDMWTFMKENKILDMQQTYDMWLKKHNPGKPGEGTPISSREGEKQIQMPTDYADIMM 790 800 810 820 830 840 850 860 870 880 890 900 pF1KA1 GYHCWLCGKNSNSKKQWQQHIQSEKHKEKVFTSDSDASGWAFRFPMGEFRLCDRLQKGKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 GYHCWLCGKNSNSKKQWQQHIQSEKHKEKVFTSDSDASGWAFRFPMGEFRLCDRLQKGKA 850 860 870 880 890 900 910 920 930 940 950 960 pF1KA1 CPDGDKCRCAHGQEELNEWLDRREVLKQKLAKARKDMLLCPRDDDFGKYNFLLQEDGDLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 CPDGDKCRCAHGQEELNEWLDRREVLKQKLAKARKDMLLCPRDDDFGKYNFLLQEDGDLA 910 920 930 940 950 960 970 pF1KA1 GATPEAPAAAATATTGE ::::::::::::::::: CCDS14 GATPEAPAAAATATTGE 970 >>CCDS10550.1 ZC3H7A gene_id:29066|Hs108|chr16 (971 aa) initn: 2491 init1: 968 opt: 2949 Z-score: 2233.6 bits: 424.7 E(32554): 4.3e-118 Smith-Waterman score: 3060; 46.5% identity (73.8% similar) in 989 aa overlap (2-955:7-969) 10 20 30 40 50 pF1KA1 MERQKRKADIEKGLQFIQSTL--PLKQEEYEAFLLKLVQNLFAEGNDLFREKDYK ::.::. .:..::::::: : : ::.: ..: ::.::: ::::..::.:.. CCDS10 MSNVSEERRKRQQNIKEGLQFIQSPLSYPGTQEQYAVYLRALVRNLFNEGNDVYREHDWN 10 20 30 40 50 60 60 70 80 90 100 110 pF1KA1 QALVQYMEGLNVADYAASDQVALPRELLCKLHVNRAACYFTMGLYEKALEDSEKALGLDS ... :: :.::.:::: :... .:.:.. ::..:: ::: .::...:.::: . .:.:.. CCDS10 NSISQYTEALNIADYAKSEEILIPKEIIEKLYINRIACYSNMGFHDKVLEDCNIVLSLNA 70 80 90 100 110 120 120 130 140 150 160 170 pF1KA1 ESIRALFRKARALNELGRHKEAYECSSRCSLALPHDESVTQLGQELAQKLGLRVRKAYKR . .::.::..::..:::.:.::. ..::::.:.:: : .: ::::::::...:::: : CCDS10 SNCKALYRKSKALSDLGRYKKAYDAVAKCSLAVPQDEHVIKLTQELAQKLGFKIRKAYVR 130 140 150 160 170 180 180 190 200 210 220 pF1KA1 PQELETFSLLSNGTAAGVADQGTSNGLG-SIDDIETDCYVDPRG---------SPAL--- . .:: : : .:....:. :..::: : . :: .:.. CCDS10 AE----LSLKS------VPGDGATKALNHSVEDIEPD-LLTPRQEAVPVVSLPAPSFSHE 190 200 210 220 230 240 250 260 pF1KA1 ----LPSTPTMPL---FP-HVLDLLAP---LDSSRTLPSTDSLDDFSDGD-VFGPELDTL : :.:.::: .: .: . : : .. .: : ..::: :.: ::: : CCDS10 VGSELASVPVMPLTSILPLQVEESALPSAVLANGGKMPFTMPEAFLDDGDMVLGDELDDL 230 240 250 260 270 280 270 280 290 300 310 320 pF1KA1 LDSLSLVQGGLSGSGV---PSELPQLIPVFPGGTPLLPPVVGGSIPVSSPL-PPASFGLV ::: .. . :.. : . .. : .: .. :: :..:... :: ::. CCDS10 LDSAPETNETVMPSALVRGPLQTASVSPSMPFSASLL-----GTLPIGARYAPPPSFSEF 290 300 310 320 330 340 330 340 350 360 370 380 pF1KA1 MDPSKKLAASVLDALDPPGPTLDPLDLLPYSETRLDALDSFGSTRGSLDKPDSFMEETN- . : . . ..:. . . . :: . . :.. .:. .. : :.. : CCDS10 YPPLTSSLEDFCSSLNSFSMSESKRDLSTSTSREGTPLNNSNSSLLLMNGPGSLFASENF 350 360 370 380 390 400 390 400 410 420 430 440 pF1KA1 ---SQDHRPPSGAQKPAPSPEPCMPNTALLIKNPLAATHEFKQACQLCYPKTGPRAGDYT :.. : : . .: .... ..:: .:::..::::.:. :.::. :.: CCDS10 LGISSQPRNDFGNFFGSAVTKP---SSSVTPRHPLEGTHELRQACQICFVKSGPKLMDFT 410 420 430 440 450 460 450 460 470 480 490 500 pF1KA1 YREGLEHKCKRDILLGRLRSSEDQTWKRIRPRPTKTSFVGSYYLCKDMINKQDCKYGDNC :. ...::::.:::.::... ::..::.::::::::.. : ::.:::. ...:.:. .: CCDS10 YHANIDHKCKKDILIGRIKNVEDKSWKKIRPRPTKTNYEGPYYICKDVAAEEECRYSGHC 470 480 490 500 510 520 510 520 530 540 550 560 pF1KA1 TFAYHQEEIDVWTEERKGTLNRDLLFDPLGGVKRGSLTIAKLLKEHQGIFTFLCEICFDS :::: :::::::: ::::...:. .: :: . .::. :::.:: : : :::: ::: CCDS10 TFAYCQEEIDVWTLERKGAFSREAFF---GGNGKINLTVFKLLQEHLGEFIFLCEKCFDH 530 540 550 560 570 570 580 590 600 610 620 pF1KA1 KPRIISKGTKDSPSVCSNLAAKHSFYNNKCLVHIVRSTSLKYSKIRQFQEHFQFDVCRHE :::.::: .::. ..::. ..:: : .:::::::.: :..::::::.:. . :.:.:::: CCDS10 KPRMISKRNKDNSTACSHPVTKHEFEDNKCLVHILRETTVKYSKIRSFHGQCQLDLCRHE 580 590 600 610 620 630 630 640 650 660 670 680 pF1KA1 VRYGCLREDSCHFAHSFIELKVWLLQQYSGMTHEDIVQESKKYWQQMEAHAGKASSSMGA ::::::::: : .:::..:::::..:. .:..:. :.::::.:::..::.. :. .: CCDS10 VRYGCLREDECFYAHSLVELKVWIMQNETGISHDAIAQESKRYWQNLEANVPGAQV-LGN 640 650 660 670 680 690 690 700 710 720 730 740 pF1KA1 PRTHGPSTFDLQMKFVCGQCWRNGQVVEPDKDLKYCSAKARHCWTKERRVLLVMSKAKRK :. .....::::.:: :::::.::::. ::::::::: :::.::.. ::: ..: CCDS10 QIM--PGFLNMKIKFVCAQCLRNGQVIEPDKNRKYCSAKARHSWTKDRRAMRVMSIERKK 700 710 720 730 740 750 750 760 770 780 790 800 pF1KA1 WVSVRPLPSIRNFPQQYDLCIHAQNGRKCQYVGNCSFAHSPEERDMWTFMKENKILDMQQ :...::::. ...: :.::: : .:.:::::::::::::::::..::.:::: : ::.: CCDS10 WMNIRPLPTKKQMPLQFDLCNHIASGKKCQYVGNCSFAHSPEEREVWTYMKENGIQDMEQ 760 770 780 790 800 810 810 820 830 840 850 860 pF1KA1 TYDMWLKKHNPGKPGEGTPISSREGEKQIQMPTDYADIMMGYHCWLCGKNSNSKKQWQQH :..:::... : . . :..:. :::.::::::.. . .:::.:::: ::.:::: : CCDS10 FYELWLKSQKNEKSEDIASQSNKENGKQIHMPTDYAEVTVDFHCWMCGKNCNSEKQWQGH 820 830 840 850 860 870 870 880 890 900 910 920 pF1KA1 IQSEKHKEKVFTSDSDASGWAFRFPMGEFRLCDRLQKGKACPDGDKCRCAHGQEELNEWL :.::::::::: ...: : ::: : : .::: ..: .::.:..:. :::. ::.:: CCDS10 ISSEKHKEKVFHTEDDQYCWQHRFPTGYFSICDRYMNG-TCPEGNSCKFAHGNAELHEWE 880 890 900 910 920 930 930 940 950 960 970 pF1KA1 DRREVLKQKLAKARKDMLLCPRDDDFGKYNFLLQEDGDLAGATPEAPAAAATATTGE .::..::.:: ::::: :. : :.:::::.::... CCDS10 ERRDALKMKLNKARKDHLIGPNDNDFGKYSFLFKDLN 940 950 960 970 977 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 20:17:00 2016 done: Wed Nov 2 20:17:00 2016 Total Scan time: 4.350 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]