FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDF0044, 989 aa 1>>>pF1KSDF0044 989 - 989 aa - 989 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.0157+/-0.000385; mu= 23.6446+/- 0.024 mean_var=77.9054+/-15.627, 0's: 0 Z-trim(114.1): 20 B-trim: 17 in 1/50 Lambda= 0.145308 statistics sampled from 23806 (23811) to 23806 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.64), E-opt: 0.2 (0.279), width: 16 Scan time: 14.430 The best scores are: opt bits E(85289) XP_016865166 (OMIM: 603671,615951) PREDICTED: zinc ( 835) 2605 556.4 2.3e-157 NP_065979 (OMIM: 603671,615951) zinc finger SWIM d (1215) 1464 317.4 3e-85 >>XP_016865166 (OMIM: 603671,615951) PREDICTED: zinc fin (835 aa) initn: 2098 init1: 1422 opt: 2605 Z-score: 2946.3 bits: 556.4 E(85289): 2.3e-157 Smith-Waterman score: 2881; 55.2% identity (75.4% similar) in 821 aa overlap (288-989:15-835) 260 270 280 290 300 310 pF1KSD EEQIQEQVKQLLSNGGYYGASQQLRSMFSKVREMLRMRDSNGARMLILMTEQFLQDTRLA :::::.:::::::::: :.::::. : ::. XP_016 MKFFPKIQKSTKFMVREMLKMRDSNGARMLTLITEQFMADPRLS 10 20 30 40 320 330 340 350 360 370 pF1KSD LWRQQGAGMTDKCRQLWDELGALWVCVVLSPHCKPEERAGWLQLLSRWDKLDVCPLEEGN ::::::..:::: :::::::::::.:.::.:::: :..:.::. :..:...:::: :.:: XP_016 LWRQQGTAMTDKYRQLWDELGALWMCIVLNPHCKLEQKASWLKQLKKWNSVDVCPWEDGN 50 60 70 80 90 100 380 390 pF1KSD YSFDGPSLQ---PTMAPA-------P---------------------------------- .. . :.: : : : : XP_016 HGSELPNLTNALPQGANANQDSSNRPHRTVFTRAIEACDLHWQDSHLQHIISSDLYTNYC 110 120 130 140 150 160 pF1KSD ------------------------------------------------------------ XP_016 YHDDTENSLFDSRGWPLWHEHVPTACARVDALRSHGYPREALRLAIAIVNTLRRQQQKQL 170 180 190 200 210 220 400 410 420 430 440 pF1KSD --------ELLQKGSTCITNTEGWVGHPLDPIGCLCRALLEACRLEEETLTLYPD---SG :: .:. : ::: ::::::::::.: : .:.::::...:.:. . : . XP_016 EMFRTQKKELPHKNITSITNLEGWVGHPLDPVGTLFSSLMEACRIDDENLSGFSDFTENM 230 240 250 260 270 280 450 460 470 480 490 500 pF1KSD PEKRKVAYQHVPVPG--SPGESYLVLALEVALLGLGQQRALPEGLYAQDKVVRNEEQLLA . ... :::.:. :::::.::.::::.:::::: .:.:::.:.:: ::::::.. XP_016 GQCKSLEYQHLPAHKFLEEGESYLTLAVEVALIGLGQQRIMPDGLYTQEKVCRNEEQLIS 290 300 310 320 330 340 510 520 530 540 550 560 pF1KSD LLEEVELDERLVQVLRKQAGLLLEGGPFSGFGEVLFRESVPMHTCARYLFTALLPHDPDL :.:.:::. ::...:::: .:::.::.::.::.. :::::::: :.::::.::::: .: XP_016 KLQEIELDDTLVKIFRKQAVFLLEAGPYSGLGEIIHRESVPMHTFAKYLFTSLLPHDAEL 350 360 370 380 390 400 570 580 590 600 610 pF1KSD AYRLALRAMRLPILETAFPAGE-PHPSPLDSIMSNRFPRWFILGHLETRQCELASTMLTA ::..::::::: .::.. :.:. .: . :.. ::.:::: :.:.:..::::::::::: XP_016 AYKIALRAMRLLVLESTAPSGDLTRPHHIASVVPNRYPRWFTLSHIESQQCELASTMLTA 410 420 430 440 450 460 620 630 640 650 660 670 pF1KSD AKGDPKWLHMVLGSIQQNIHSPALLFKLAQDACKTATPVSAPPDTTLLGIALELGLQVMR :::: . :. :: :::.:::: . .::::::: : :: ... :: ::: ..::::::::: XP_016 AKGDVRRLETVLESIQKNIHSSSHIFKLAQDAFKIATLMDSLPDITLLKVSLELGLQVMR 470 480 490 500 510 520 680 690 700 710 720 730 pF1KSD MTLNVMTWRRREMVRWLVSCATEIGPQALMNIMQNWYSLFTPVEAATIVAVTGTTHATLL :::....:::::::::::.::::.: :: .:::.:..::::.::..:::.: ...:.. XP_016 MTLSTLNWRRREMVRWLVTCATEVGVYALDSIMQTWFTLFTPTEATSIVATTVMSNSTIV 530 540 550 560 570 580 740 750 760 770 780 790 pF1KSD RLQLDTSRREELWACARTLALQCAMKDPQNCALPALTLCEKNHSAFEAAYQIVLDAAAGG ::.:: ..:.: . :::::::::::::::::: :::::::.: :::.:::::::::. : XP_016 RLHLDCHQQEKLASSARTLALQCAMKDPQNCALSALTLCEKDHIAFETAYQIVLDAATTG 590 600 610 620 630 640 800 810 820 830 840 850 pF1KSD LGHAHLFTVARYMEHRGLPLRAYKLATLALAQLSIAFNQDSHPAVNDVLWACSLSHSLGR .....:::.:::::::: :.:::::::::...:....:::.:::.:::::::.::::::. XP_016 MSYTQLFTIARYMEHRGYPMRAYKLATLAMTHLNLSYNQDTHPAINDVLWACALSHSLGK 650 660 670 680 690 700 860 870 880 890 900 910 pF1KSD HELSAIVPLIIRSIHCAPMLSDILRRWTLSAPGL-GPLGARRAAKPLGADRAPLCQLLDA .::.::.::...:..:: .::::::: ::..::. : : : ..: .. :.::: ::::: XP_016 NELAAIIPLVVKSVKCATVLSDILRRCTLTTPGMVGLHGRRNSGKLMSLDKAPLRQLLDA 710 720 730 740 750 760 920 930 940 950 960 970 pF1KSD AVTAYITTSHSRLTHISPRHYGDFIEFLGKARETFLLAPDGHLQFSQFLENLKQTYKGKK .. :::.:.::::::::::::..:::::.:::::::.: :::.::.::..:::: ::::: XP_016 TIGAYINTTHSRLTHISPRHYSEFIEFLSKARETFLMAHDGHIQFTQFIDNLKQIYKGKK 770 780 790 800 810 820 980 pF1KSD KLMLLVRERFG :::.::::::: XP_016 KLMMLVRERFG 830 >>NP_065979 (OMIM: 603671,615951) zinc finger SWIM domai (1215 aa) initn: 3350 init1: 1464 opt: 1464 Z-score: 1651.5 bits: 317.4 E(85289): 3e-85 Smith-Waterman score: 3560; 54.3% identity (73.0% similar) in 1050 aa overlap (34-900:76-1125) 10 20 30 40 50 60 pF1KSD PAAKRSRGCPAGPEERDAGAGAARGRGRPEALLDLSAKRVAESWAFEQVEERFSRVPEPV .:::..:.::::.: :..::::: :.:::: NP_065 PRAGGAAAAAACGGGAALGLLPPGKTQSPESLLDIAARRVAEKWPFQRVEERFERIPEPV 50 60 70 80 90 100 70 80 pF1KSD QKRIVFWSFPRSEREICMYSSL-------GYP---------------------P------ :.:::.:::::::::::::::. : : : NP_065 QRRIVYWSFPRSEREICMYSSFNTGGGAAGGPGDDSGGGGGAGGGGGGGSSSSPAATSAA 110 120 130 140 150 160 90 100 110 pF1KSD -----------------------P--------EGEHDARVPFTRGLHLLQSGAVDRVLQV : .: ..:.:: ::. ::.:: :: :::: NP_065 ATSAAAAAAAAAAAAAAAAGAGAPSVGAAGAADGGDETRLPFRRGIALLESGCVDNVLQV 170 180 190 200 210 220 120 130 140 150 160 170 pF1KSD GFHLSGNIREPGSPGEPERLYHVSISFDRCKITSVSCGCDNRDLFYCAHVVALSLYRIRH ::::::.. ::. .::: . .:.:::::::::::.:.: :.:.:::::::::::::::. NP_065 GFHLSGTVTEPAIQSEPETVCNVAISFDRCKITSVTCSCGNKDIFYCAHVVALSLYRIRK 230 240 250 260 270 280 180 190 200 210 220 230 pF1KSD AHQVELRLPISETLSQMNRDQLQKFVQYLISAHHTEVLPTAQRLADEILLLGSEINLVNG ::.:.::::::: :::::::::::::::..::::::::::.:::::: .:::: :.: NP_065 PDQVKLHLPISETLFQMNRDQLQKFVQYLITVHHTEVLPTAQKLADEILSQNSEINQVHG 290 300 310 320 330 340 240 250 260 270 280 290 pF1KSD APDPTAGAGIEDANCWHLDEEQIQEQVKQLLSNGGYYGASQQLRSMFSKVREMLRMRDSN ::::::::.:.: :::::::::.::::: .::.:::.:...:: .:.::::::.::::: NP_065 APDPTAGASIDDENCWHLDEEQVQEQVKLFLSQGGYHGSGKQLNLLFAKVREMLKMRDSN 350 360 370 380 390 400 300 310 320 330 340 350 pF1KSD GARMLILMTEQFLQDTRLALWRQQGAGMTDKCRQLWDELGALWVCVVLSPHCKPEERAGW ::::: :.::::. : ::.::::::..:::: :::::::::::.:.::.:::: :..:.: NP_065 GARMLTLITEQFMADPRLSLWRQQGTAMTDKYRQLWDELGALWMCIVLNPHCKLEQKASW 410 420 430 440 450 460 360 370 380 390 pF1KSD LQLLSRWDKLDVCPLEEGNYSFDGPSLQ---PTMAPA-------P--------------- :. :..:...:::: :.::.. . :.: : : : : NP_065 LKQLKKWNSVDVCPWEDGNHGSELPNLTNALPQGANANQDSSNRPHRTVFTRAIEACDLH 470 480 490 500 510 520 pF1KSD ------------------------------------------------------------ NP_065 WQDSHLQHIISSDLYTNYCYHDDTENSLFDSRGWPLWHEHVPTACARVDALRSHGYPREA 530 540 550 560 570 580 400 410 420 pF1KSD ---------------------------ELLQKGSTCITNTEGWVGHPLDPIGCLCRALLE :: .:. : ::: ::::::::::.: : .:.: NP_065 LRLAIAIVNTLRRQQQKQLEMFRTQKKELPHKNITSITNLEGWVGHPLDPVGTLFSSLME 590 600 610 620 630 640 430 440 450 460 470 480 pF1KSD ACRLEEETLTLYPD---SGPEKRKVAYQHVPVPG--SPGESYLVLALEVALLGLGQQRAL :::...:.:. . : . . ... :::.:. :::::.::.::::.:::::: . NP_065 ACRIDDENLSGFSDFTENMGQCKSLEYQHLPAHKFLEEGESYLTLAVEVALIGLGQQRIM 650 660 670 680 690 700 490 500 510 520 530 540 pF1KSD PEGLYAQDKVVRNEEQLLALLEEVELDERLVQVLRKQAGLLLEGGPFSGFGEVLFRESVP :.:::.:.:: ::::::.. :.:.:::. ::...:::: .:::.::.::.::.. ::::: NP_065 PDGLYTQEKVCRNEEQLISKLQEIELDDTLVKIFRKQAVFLLEAGPYSGLGEIIHRESVP 710 720 730 740 750 760 550 560 570 580 590 600 pF1KSD MHTCARYLFTALLPHDPDLAYRLALRAMRLPILETAFPAGE-PHPSPLDSIMSNRFPRWF ::: :.::::.::::: .:::..::::::: .::.. :.:. .: . :.. ::.:::: NP_065 MHTFAKYLFTSLLPHDAELAYKIALRAMRLLVLESTAPSGDLTRPHHIASVVPNRYPRWF 770 780 790 800 810 820 610 620 630 640 650 660 pF1KSD ILGHLETRQCELASTMLTAAKGDPKWLHMVLGSIQQNIHSPALLFKLAQDACKTATPVSA :.:.:..::::::::::::::: . :. :: :::.:::: . .::::::: : :: ... NP_065 TLSHIESQQCELASTMLTAAKGDVRRLETVLESIQKNIHSSSHIFKLAQDAFKIATLMDS 830 840 850 860 870 880 670 680 690 700 710 720 pF1KSD PPDTTLLGIALELGLQVMRMTLNVMTWRRREMVRWLVSCATEIGPQALMNIMQNWYSLFT :: ::: ..::::::::::::....:::::::::::.::::.: :: .:::.:..::: NP_065 LPDITLLKVSLELGLQVMRMTLSTLNWRRREMVRWLVTCATEVGVYALDSIMQTWFTLFT 890 900 910 920 930 940 730 740 750 760 770 780 pF1KSD PVEAATIVAVTGTTHATLLRLQLDTSRREELWACARTLALQCAMKDPQNCALPALTLCEK :.::..:::.: ...:..::.:: ..:.: . :::::::::::::::::: ::::::: NP_065 PTEATSIVATTVMSNSTIVRLHLDCHQQEKLASSARTLALQCAMKDPQNCALSALTLCEK 950 960 970 980 990 1000 790 800 810 820 830 840 pF1KSD NHSAFEAAYQIVLDAAAGGLGHAHLFTVARYMEHRGLPLRAYKLATLALAQLSIAFNQDS .: :::.:::::::::. :.....:::.:::::::: :.:::::::::...:....:::. NP_065 DHIAFETAYQIVLDAATTGMSYTQLFTIARYMEHRGYPMRAYKLATLAMTHLNLSYNQDT 1010 1020 1030 1040 1050 1060 850 860 870 880 890 900 pF1KSD HPAVNDVLWACSLSHSLGRHELSAIVPLIIRSIHCAPMLSDILRRWTLSAPGLGPLGARR :::.:::::::.::::::..::.::.::...:..:: .::::::: ::..::. : .:: NP_065 HPAINDVLWACALSHSLGKNELAAIIPLVVKSVKCATVLSDILRRCTLTTPGMVGLHGRR 1070 1080 1090 1100 1110 1120 910 920 930 940 950 960 pF1KSD AAKPLGADRAPLCQLLDAAVTAYITTSHSRLTHISPRHYGDFIEFLGKARETFLLAPDGH NP_065 NSGKLMSLDKAPLRQLLDATIGAYINTTHSRLTHISPRHYSEFIEFLSKARETFLMAHDG 1130 1140 1150 1160 1170 1180 >-- initn: 446 init1: 446 opt: 446 Z-score: 498.1 bits: 103.9 E(85289): 5.3e-21 Smith-Waterman score: 446; 73.0% identity (93.3% similar) in 89 aa overlap (901-989:1127-1215) 880 890 900 910 920 930 pF1KSD RSIHCAPMLSDILRRWTLSAPGLGPLGARRAAKPLGADRAPLCQLLDAAVTAYITTSHSR ..: .. :.::: :::::.. :::.:.::: NP_065 SVKCATVLSDILRRCTLTTPGMVGLHGRRNSGKLMSLDKAPLRQLLDATIGAYINTTHSR 1100 1110 1120 1130 1140 1150 940 950 960 970 980 pF1KSD LTHISPRHYGDFIEFLGKARETFLLAPDGHLQFSQFLENLKQTYKGKKKLMLLVRERFG :::::::::..:::::.:::::::.: :::.::.::..:::: ::::::::.::::::: NP_065 LTHISPRHYSEFIEFLSKARETFLMAHDGHIQFTQFIDNLKQIYKGKKKLMMLVRERFG 1160 1170 1180 1190 1200 1210 989 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 08:50:18 2016 done: Thu Nov 3 08:50:20 2016 Total Scan time: 14.430 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]