FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0069, 738 aa 1>>>pF1KE0069 738 - 738 aa - 738 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.4689+/-0.000844; mu= 19.2317+/- 0.051 mean_var=66.7407+/-13.383, 0's: 0 Z-trim(106.2): 15 B-trim: 0 in 0/52 Lambda= 0.156992 statistics sampled from 8858 (8868) to 8858 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.636), E-opt: 0.2 (0.272), width: 16 Scan time: 3.950 The best scores are: opt bits E(32554) CCDS3325.1 MELTF gene_id:4241|Hs108|chr3 ( 738) 5067 1156.9 0 CCDS3326.1 MELTF gene_id:4241|Hs108|chr3 ( 302) 1614 374.6 1.2e-103 CCDS56251.1 LTF gene_id:4057|Hs108|chr3 ( 666) 899 212.8 1.4e-54 CCDS33747.1 LTF gene_id:4057|Hs108|chr3 ( 710) 899 212.8 1.5e-54 CCDS82763.1 LTF gene_id:4057|Hs108|chr3 ( 708) 836 198.6 2.9e-50 CCDS3080.1 TF gene_id:7018|Hs108|chr3 ( 698) 606 146.5 1.4e-34 >>CCDS3325.1 MELTF gene_id:4241|Hs108|chr3 (738 aa) initn: 5067 init1: 5067 opt: 5067 Z-score: 6194.7 bits: 1156.9 E(32554): 0 Smith-Waterman score: 5067; 100.0% identity (100.0% similar) in 738 aa overlap (1-738:1-738) 10 20 30 40 50 60 pF1KE0 MRGPSGALWLLLALRTVLGGMEVRWCATSDPEQHKCGNMSEAFREAGIQPSLLCVRGTSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MRGPSGALWLLLALRTVLGGMEVRWCATSDPEQHKCGNMSEAFREAGIQPSLLCVRGTSA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 DHCVQLIAAQEADAITLDGGAIYEAGKEHGLKPVVGEVYDQEVGTSYYAVAVVRRSSHVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 DHCVQLIAAQEADAITLDGGAIYEAGKEHGLKPVVGEVYDQEVGTSYYAVAVVRRSSHVT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 IDTLKGVKSCHTGINRTVGWNVPVGYLVESGRLSVMGCDVLKAVSDYFGGSCVPGAGETS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 IDTLKGVKSCHTGINRTVGWNVPVGYLVESGRLSVMGCDVLKAVSDYFGGSCVPGAGETS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 YSESLCRLCRGDSSGEGVCDKSPLERYYDYSGAFRCLAEGAGDVAFVKHSTVLENTDGKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 YSESLCRLCRGDSSGEGVCDKSPLERYYDYSGAFRCLAEGAGDVAFVKHSTVLENTDGKT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 LPSWGQALLSQDFELLCRDGSRADVTEWRQCHLARVPAHAVVVRADTDGGLIFRLLNEGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LPSWGQALLSQDFELLCRDGSRADVTEWRQCHLARVPAHAVVVRADTDGGLIFRLLNEGQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 RLFSHEGSSFQMFSSEAYGQKDLLFKDSTSELVPIATQTYEAWLGHEYLHAMKGLLCDPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RLFSHEGSSFQMFSSEAYGQKDLLFKDSTSELVPIATQTYEAWLGHEYLHAMKGLLCDPN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE0 RLPPYLRWCVLSTPEIQKCGDMAVAFRRQRLKPEIQCVSAKSPQHCMERIQAEQVDAVTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RLPPYLRWCVLSTPEIQKCGDMAVAFRRQRLKPEIQCVSAKSPQHCMERIQAEQVDAVTL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE0 SGEDIYTAGKTYGLVPAAGEHYAPEDSSNSYYVVAVVRRDSSHAFTLDELRGKRSCHAGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SGEDIYTAGKTYGLVPAAGEHYAPEDSSNSYYVVAVVRRDSSHAFTLDELRGKRSCHAGF 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE0 GSPAGWDVPVGALIQRGFIRPKDCDVLTAVSEFFNASCVPVNNPKNYPSSLCALCVGDEQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GSPAGWDVPVGALIQRGFIRPKDCDVLTAVSEFFNASCVPVNNPKNYPSSLCALCVGDEQ 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE0 GRNKCVGNSQERYYGYRGAFRCLVENAGDVAFVRHTTVFDNTNGHNSEPWAAELRSEDYE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GRNKCVGNSQERYYGYRGAFRCLVENAGDVAFVRHTTVFDNTNGHNSEPWAAELRSEDYE 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE0 LLCPNGARAEVSQFAACNLAQIPPHAVMVRPDTNIFTVYGLLDKAQDLFGDDHNKNGFKM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LLCPNGARAEVSQFAACNLAQIPPHAVMVRPDTNIFTVYGLLDKAQDLFGDDHNKNGFKM 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE0 FDSSNYHGQDLLFKDATVRAVPVGEKTTYRGWLGLDYVAALEGMSSQQCSGAAAPAPGAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 FDSSNYHGQDLLFKDATVRAVPVGEKTTYRGWLGLDYVAALEGMSSQQCSGAAAPAPGAP 670 680 690 700 710 720 730 pF1KE0 LLPLLLPALAARLLPPAL :::::::::::::::::: CCDS33 LLPLLLPALAARLLPPAL 730 >>CCDS3326.1 MELTF gene_id:4241|Hs108|chr3 (302 aa) initn: 1639 init1: 1612 opt: 1614 Z-score: 1974.0 bits: 374.6 E(32554): 1.2e-103 Smith-Waterman score: 1614; 94.2% identity (95.7% similar) in 258 aa overlap (1-257:1-256) 10 20 30 40 50 60 pF1KE0 MRGPSGALWLLLALRTVLGGMEVRWCATSDPEQHKCGNMSEAFREAGIQPSLLCVRGTSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MRGPSGALWLLLALRTVLGGMEVRWCATSDPEQHKCGNMSEAFREAGIQPSLLCVRGTSA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 DHCVQLIAAQEADAITLDGGAIYEAGKEHGLKPVVGEVYDQEVGTSYYAVAVVRRSSHVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 DHCVQLIAAQEADAITLDGGAIYEAGKEHGLKPVVGEVYDQEVGTSYYAVAVVRRSSHVT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 IDTLKGVKSCHTGINRTVGWNVPVGYLVESGRLSVMGCDVLKAVSDYFGGSCVPGAGETS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 IDTLKGVKSCHTGINRTVGWNVPVGYLVESGRLSVMGCDVLKAVSDYFGGSCVPGAGETS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 YSESLCRLCRGDSSGEGVCDKSPLERYYDYSGAFRCLAEGAGDVAFVKHSTVLENTDGKT ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: . CCDS33 YSESLCRLCRGDSSGEGVCDKSPLERYYDYSGAFRCLAEGAGDVAFVKHSTVLENTDES- 190 200 210 220 230 250 260 270 280 290 pF1KE0 LPSWGQALL-SQDFELLCRDGSRADVTEWRQCHLARVPAHAVVVRADTDGGLIFRLLNEG :: :. :.. : : CCDS33 -PSRRQTWTRSEEEEGECPAHEEARRTMRSSAGQAWKWAPVHRPQDESDKGEFGKRAKSR 240 250 260 270 280 290 >>CCDS56251.1 LTF gene_id:4057|Hs108|chr3 (666 aa) initn: 702 init1: 461 opt: 899 Z-score: 1093.5 bits: 212.8 E(32554): 1.4e-54 Smith-Waterman score: 1582; 40.9% identity (67.4% similar) in 687 aa overlap (50-710:7-653) 20 30 40 50 60 70 pF1KE0 GMEVRWCATSDPEQHKCGNMSEAFREAGIQPSLLCVRGTSADHCVQLIAAQEADAITLDG : . :.. : .:.: :: ..:::.:::: CCDS56 MRKVRGPPVSCIKRDSPIQCIQAIAENRADAVTLDG 10 20 30 80 90 100 110 120 130 pF1KE0 GAIYEAG-KEHGLKPVVGEVYDQEVG--TSYYAVAVVRRSSHVTIDTLKGVKSCHTGINR : ::::: . :.::..::: : : :::::::.... .. :.:.::::::. : CCDS56 GFIYEAGLAPYKLRPVAAEVYGTERQPRTHYYAVAVVKKGGSFQLNELQGLKSCHTGLRR 40 50 60 70 80 90 140 150 160 170 180 190 pF1KE0 TVGWNVPVGYLVESGRLSVMGCDVLKAVSDYFGGSCVPGAGETSYSESLCRLCRGDSSGE :.:::::.: : . . ::. .:..:::::: . .. .::::: : .:: CCDS56 TAGWNVPIGTLRPFLNWTGPPEPIEAAVARFFSASCVPGADKGQFP-NLCRLCAG--TGE 100 110 120 130 140 150 200 210 220 230 240 250 pF1KE0 GVCDKSPLERYYDYSGAFRCLAEGAGDVAFVKHSTVLENTDGKTLPSWGQALLSQDFELL . : : : :..:::::.:: .:::::::...:::.:. . .. ...::: CCDS56 NKCAFSSQEPYFSYSGAFKCLRDGAGDVAFIRESTVFEDLSDEAE--------RDEYELL 160 170 180 190 200 260 270 280 290 300 310 pF1KE0 CRDGSRADVTEWRQCHLARVPAHAVVVRADTDG--GLIFRLLNEGQRLFSHEGS-SFQMF : :..: : ....:::::::.::::.:. ..: :. :: ..:. :... : .::.: CCDS56 CPDNTRKPVDKFKDCHLARVPSHAVVARS-VNGKEDAIWNLLRQAQEKFGKDKSPKFQLF 210 220 230 240 250 260 320 330 340 350 360 pF1KE0 SSEAYGQKDLLFKDST---SELVP-IATQTYEAWLGHEYLHAMKGLLCDPNRLPPY---L .: . ::::::::::. :.. : : . : :: :. :...: . ... . CCDS56 GSPS-GQKDLLFKDSAIGFSRVPPRIDSGLY---LGSGYFTAIQNLRKSEEEVAARRARV 270 280 290 300 310 320 370 380 390 400 410 420 pF1KE0 RWCVLSTPEIQKCGDMAVAFRRQRLKPEIQCVSAKSPQHCMERIQAEQVDAVTLSGEDIY ::... :..::.. . . . : ::.. . :. . ..::..:.: .: CCDS56 VWCAVGEQELRKCNQWS-----GLSEGSVTCSSASTTEDCIALVLKGEADAMSLDGGYVY 330 340 350 360 370 430 440 450 460 470 pF1KE0 TAGKTYGLVPAAGEHYAPEDSSN-----------SYYVVAVVRRDSSHAFTLDELRGKRS :::: ::::. .:.: ..::. .: .:::::: :. ..: . ..::.: CCDS56 TAGKC-GLVPVLAENYKSQQSSDPDPNCVDRPVEGYLAVAVVRR-SDTSLTWNSVKGKKS 380 390 400 410 420 430 480 490 500 510 520 530 pF1KE0 CHAGFGSPAGWDVPVGALIQRGFIRPKDCDVLTAVSEFFNASCVPVNNPKNYPSSLCALC ::.. :::..:.: : : . .: .:.:. ::.: ..:. :.::::: CCDS56 CHTAVDRTAGWNIPMGLL----FNQTGSCKF----DEYFSQSCAPGSDPR---SNLCALC 440 450 460 470 480 540 550 560 570 580 590 pF1KE0 VGDEQGRNKCVGNSQERYYGYRGAFRCLVENAGDVAFVRHTTVFDNTNGHNSEPWAAELR .:::::.:::: ::.:::::: ::::::.:::::::::. .::..::.:.:.: :: .:. CCDS56 IGDEQGENKCVPNSNERYYGYTGAFRCLAENAGDVAFVKDVTVLQNTDGNNNEAWAKDLK 490 500 510 520 530 540 600 610 620 630 640 650 pF1KE0 SEDYELLCPNGARAEVSQFAACNLAQIPPHAVMVRPDTNIFTVYGLLDKAQDLFGDDHNK :. ::: .: : :.. .:.::. : :::. : : .. . .: . : :: . . CCDS56 LADFALLCLDGKRKPVTEARSCHLAMAPNHAVVSRMD-KVERLKQVLLHQQAKFGRNGSD 550 560 570 580 590 600 660 670 680 690 700 710 pF1KE0 --NGFKMFDSSNYHGQDLLFKDATVRAVPVGEKTTYRGWLGLDYVAALEGMSSQQCSGAA . : .:.: . ..:::.: : . . ::::. .:: .:::.. .. ..:: CCDS56 CPDKFCLFQSET---KNLLFNDNTECLARLHGKTTYEKYLGPQYVAGITNL--KKCSTSP 610 620 630 640 650 720 730 pF1KE0 APAPGAPLLPLLLPALAARLLPPAL CCDS56 LLEACEFLRK 660 >>CCDS33747.1 LTF gene_id:4057|Hs108|chr3 (710 aa) initn: 1039 init1: 461 opt: 899 Z-score: 1093.1 bits: 212.8 E(32554): 1.5e-54 Smith-Waterman score: 1652; 40.8% identity (66.9% similar) in 731 aa overlap (6-710:12-697) 10 20 30 40 50 pF1KE0 MRGPSGALWLLLALRTVLGGMEVRWCATSDPEQHKCGNMSEAFREAGIQPSLLC ::: : :: : :.:::.:.:: :: . .. .:.. : . : CCDS33 MKLVFLVLLFLGALGLCLAGRR----RSVQWCAVSQPEATKCFQWQRNMRKVR-GPPVSC 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 VRGTSADHCVQLIAAQEADAITLDGGAIYEAG-KEHGLKPVVGEVYDQEVG--TSYYAVA .. : .:.: :: ..:::.::::: ::::: . :.::..::: : : ::::: CCDS33 IKRDSPIQCIQAIAENRADAVTLDGGFIYEAGLAPYKLRPVAAEVYGTERQPRTHYYAVA 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 VVRRSSHVTIDTLKGVKSCHTGINRTVGWNVPVGYLVESGRLSVMGCDVLKAVSDYFGGS ::.... .. :.:.::::::. ::.:::::.: : . . ::. .:..: CCDS33 VVKKGGSFQLNELQGLKSCHTGLRRTAGWNVPIGTLRPFLNWTGPPEPIEAAVARFFSAS 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 CVPGAGETSYSESLCRLCRGDSSGEGVCDKSPLERYYDYSGAFRCLAEGAGDVAFVKHST ::::: . .. .::::: : .::. : : : :..:::::.:: .:::::::...:: CCDS33 CVPGADKGQFP-NLCRLCAG--TGENKCAFSSQEPYFSYSGAFKCLRDGAGDVAFIREST 180 190 200 210 220 230 240 250 260 270 280 pF1KE0 VLENTDGKTLPSWGQALLSQDFELLCRDGSRADVTEWRQCHLARVPAHAVVVRADTDG-- :.:. . .. ...:::: :..: : ....:::::::.::::.:. ..: CCDS33 VFEDLSDEAE--------RDEYELLCPDNTRKPVDKFKDCHLARVPSHAVVARS-VNGKE 240 250 260 270 280 290 300 310 320 330 340 pF1KE0 GLIFRLLNEGQRLFSHEGS-SFQMFSSEAYGQKDLLFKDST---SELVP-IATQTYEAWL :. :: ..:. :... : .::.:.: . ::::::::::. :.. : : . : : CCDS33 DAIWNLLRQAQEKFGKDKSPKFQLFGSPS-GQKDLLFKDSAIGFSRVPPRIDSGLY---L 290 300 310 320 330 350 360 370 380 390 400 pF1KE0 GHEYLHAMKGLLCDPNRLPPY---LRWCVLSTPEIQKCGDMAVAFRRQRLKPEIQCVSAK : :. :...: . ... . ::... :..::.. . . . : ::. CCDS33 GSGYFTAIQNLRKSEEEVAARRARVVWCAVGEQELRKCNQWS-----GLSEGSVTCSSAS 340 350 360 370 380 390 410 420 430 440 450 pF1KE0 SPQHCMERIQAEQVDAVTLSGEDIYTAGKTYGLVPAAGEHYAPEDSSN-----------S . . :. . ..::..:.: .::::: ::::. .:.: ..::. . CCDS33 TTEDCIALVLKGEADAMSLDGGYVYTAGKC-GLVPVLAENYKSQQSSDPDPNCVDRPVEG 400 410 420 430 440 450 460 470 480 490 500 510 pF1KE0 YYVVAVVRRDSSHAFTLDELRGKRSCHAGFGSPAGWDVPVGALIQRGFIRPKDCDVLTAV : .:::::: :. ..: . ..::.:::.. :::..:.: : : . .: CCDS33 YLAVAVVRR-SDTSLTWNSVKGKKSCHTAVDRTAGWNIPMGLL----FNQTGSCKF---- 460 470 480 490 500 520 530 540 550 560 570 pF1KE0 SEFFNASCVPVNNPKNYPSSLCALCVGDEQGRNKCVGNSQERYYGYRGAFRCLVENAGDV .:.:. ::.: ..:. :.:::::.:::::.:::: ::.:::::: ::::::.:::::: CCDS33 DEYFSQSCAPGSDPR---SNLCALCIGDEQGENKCVPNSNERYYGYTGAFRCLAENAGDV 510 520 530 540 550 560 580 590 600 610 620 630 pF1KE0 AFVRHTTVFDNTNGHNSEPWAAELRSEDYELLCPNGARAEVSQFAACNLAQIPPHAVMVR :::. .::..::.:.:.: :: .:. :. ::: .: : :.. .:.::. : :::. : CCDS33 AFVKDVTVLQNTDGNNNEAWAKDLKLADFALLCLDGKRKPVTEARSCHLAMAPNHAVVSR 570 580 590 600 610 620 640 650 660 670 680 pF1KE0 PDTNIFTVYGLLDKAQDLFGDDHNK--NGFKMFDSSNYHGQDLLFKDATVRAVPVGEKTT : .. . .: . : :: . . . : .:.: . ..:::.: : . . ::: CCDS33 MD-KVERLKQVLLHQQAKFGRNGSDCPDKFCLFQSET---KNLLFNDNTECLARLHGKTT 630 640 650 660 670 690 700 710 720 730 pF1KE0 YRGWLGLDYVAALEGMSSQQCSGAAAPAPGAPLLPLLLPALAARLLPPAL :. .:: .:::.. .. ..:: CCDS33 YEKYLGPQYVAGITNL--KKCSTSPLLEACEFLRK 680 690 700 710 >>CCDS82763.1 LTF gene_id:4057|Hs108|chr3 (708 aa) initn: 1037 init1: 461 opt: 836 Z-score: 1016.0 bits: 198.6 E(32554): 2.9e-50 Smith-Waterman score: 1641; 40.9% identity (67.2% similar) in 731 aa overlap (6-710:12-695) 10 20 30 40 50 pF1KE0 MRGPSGALWLLLALRTVLGGMEVRWCATSDPEQHKCGNMSEAFREAGIQPSLLC ::: : :: : :.:::.:.:: :: . .. .:.. : . : CCDS82 MKLVFLVLLFLGALGLCLAGRR----RSVQWCAVSQPEATKCFQWQRNMRKVR-GPPVSC 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 VRGTSADHCVQLIAAQEADAITLDGGAIYEAG-KEHGLKPVVGEVYDQEVG--TSYYAVA .. : .:.: :: ..:::.::::: ::::: . :.::..::: : : ::::: CCDS82 IKRDSPIQCIQAIAENRADAVTLDGGFIYEAGLAPYKLRPVAAEVYGTERQPRTHYYAVA 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 VVRRSSHVTIDTLKGVKSCHTGINRTVGWNVPVGYLVESGRLSVMGCDVLKAVSDYFGGS ::.... .. :.:.::::::. ::.:::::.: : . . ::. .:..: CCDS82 VVKKGGSFQLNELQGLKSCHTGLRRTAGWNVPIGTLRPFLNWTGPPEPIEAAVARFFSAS 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 CVPGAGETSYSESLCRLCRGDSSGEGVCDKSPLERYYDYSGAFRCLAEGAGDVAFVKHST ::::: . .. .::::: : .::. : : : :..:::::.:: .:::::::...:: CCDS82 CVPGADKGQFP-NLCRLCAG--TGENKCAFSSQEPYFSYSGAFKCLRDGAGDVAFIREST 180 190 200 210 220 230 240 250 260 270 280 pF1KE0 VLENTDGKTLPSWGQALLSQDFELLCRDGSRADVTEWRQCHLARVPAHAVVVRADTDG-- :.:. . .. ...:::: :..: : ....:::::::.::::.:. ..: CCDS82 VFEDLSDEAE--------RDEYELLCPDNTRKPVDKFKDCHLARVPSHAVVARS-VNGKE 240 250 260 270 280 290 300 310 320 330 340 pF1KE0 GLIFRLLNEGQRLFSHEGS-SFQMFSSEAYGQKDLLFKDST---SELVP-IATQTYEAWL :. :: ..:. :... : .::.:.: . ::::::::::. :.. : : . : : CCDS82 DAIWNLLRQAQEKFGKDKSPKFQLFGSPS-GQKDLLFKDSAIGFSRVPPRIDSGLY---L 290 300 310 320 330 350 360 370 380 390 400 pF1KE0 GHEYLHAMKGLLCDPNRLPPY---LRWCVLSTPEIQKCGDMAVAFRRQRLKPEIQCVSAK : :. :...: . ... . ::... :..::.. . . . : ::. CCDS82 GSGYFTAIQNLRKSEEEVAARRARVVWCAVGEQELRKCNQWS-----GLSEGSVTCSSAS 340 350 360 370 380 390 410 420 430 440 450 pF1KE0 SPQHCMERIQAEQVDAVTLSGEDIYTAGKTYGLVPAAGEHYAPEDSSN-----------S . . :. ...: .::..:.: .::::: ::::. .:.: ..::. . CCDS82 TTEDCIA-LKGE-ADAMSLDGGYVYTAGKC-GLVPVLAENYKSQQSSDPDPNCVDRPVEG 400 410 420 430 440 450 460 470 480 490 500 510 pF1KE0 YYVVAVVRRDSSHAFTLDELRGKRSCHAGFGSPAGWDVPVGALIQRGFIRPKDCDVLTAV : .:::::: :. ..: . ..::.:::.. :::..:.: : : . .: CCDS82 YLAVAVVRR-SDTSLTWNSVKGKKSCHTAVDRTAGWNIPMGLL----FNQTGSCKF---- 460 470 480 490 500 520 530 540 550 560 570 pF1KE0 SEFFNASCVPVNNPKNYPSSLCALCVGDEQGRNKCVGNSQERYYGYRGAFRCLVENAGDV .:.:. ::.: ..:. :.:::::.:::::.:::: ::.:::::: ::::::.:::::: CCDS82 DEYFSQSCAPGSDPR---SNLCALCIGDEQGENKCVPNSNERYYGYTGAFRCLAENAGDV 510 520 530 540 550 580 590 600 610 620 630 pF1KE0 AFVRHTTVFDNTNGHNSEPWAAELRSEDYELLCPNGARAEVSQFAACNLAQIPPHAVMVR :::. .::..::.:.:.: :: .:. :. ::: .: : :.. .:.::. : :::. : CCDS82 AFVKDVTVLQNTDGNNNEAWAKDLKLADFALLCLDGKRKPVTEARSCHLAMAPNHAVVSR 560 570 580 590 600 610 640 650 660 670 680 pF1KE0 PDTNIFTVYGLLDKAQDLFGDDHNK--NGFKMFDSSNYHGQDLLFKDATVRAVPVGEKTT : .. . .: . : :: . . . : .:.: . ..:::.: : . . ::: CCDS82 MD-KVERLKQVLLHQQAKFGRNGSDCPDKFCLFQSET---KNLLFNDNTECLARLHGKTT 620 630 640 650 660 670 690 700 710 720 730 pF1KE0 YRGWLGLDYVAALEGMSSQQCSGAAAPAPGAPLLPLLLPALAARLLPPAL :. .:: .:::.. .. ..:: CCDS82 YEKYLGPQYVAGITNL--KKCSTSPLLEACEFLRK 680 690 700 >>CCDS3080.1 TF gene_id:7018|Hs108|chr3 (698 aa) initn: 579 init1: 277 opt: 606 Z-score: 734.5 bits: 146.5 E(32554): 1.4e-34 Smith-Waterman score: 899; 39.6% identity (66.7% similar) in 414 aa overlap (310-710:301-685) 280 290 300 310 320 330 pF1KE0 AVVVRADTDGGLIFRLLNEGQRLFSHEGSSFQMFSSEAYGQKDLLFKDSTSELVPIATQT ::.::: .: ::::::::. .. . . CCDS30 VARSMGGKEDLIWELLNQAQEHFGKDKSKEFQLFSSP-HG-KDLLFKDSAHGFLKVPPRM 280 290 300 310 320 340 350 360 370 380 390 pF1KE0 -YEAWLGHEYLHAMKGL---LCD--PNRLPPYLRWCVLSTPEIQKCGDMAVAFRRQRLKP . .::.::. :...: : :. ..::.:: : :: . .: CCDS30 DAKMYLGYEYVTAIRNLREGTCPEAPTDECKPVKWCALSHHERLKCDEWSVN-----SVG 330 340 350 360 370 380 400 410 420 430 440 450 pF1KE0 EIQCVSAKSPQHCMERIQAEQVDAVTLSGEDIYTAGKTYGLVPAAGEHYAPEDSSNS--- .:.::::.. . :. .:. ..::..:.: .: ::: ::::. .:.: :. .. CCDS30 KIECVSAETTEDCIAKIMNGEADAMSLDGGFVYIAGKC-GLVPVLAENYNKSDNCEDTPE 390 400 410 420 430 440 460 470 480 490 500 pF1KE0 --YYVVAVVRRDSSHAFTLDELRGKRSCHAGFGSPAGWDVPVGALIQRGFIRPKDCDVLT :...:::....: .: :.:.::.:::.. : :::..:.: : . . . : CCDS30 AGYFAIAVVKKSASD-LTWDNLKGKKSCHTAVGRTAGWNIPMGLL----YNKINHCR--- 450 460 470 480 490 510 520 530 540 550 560 pF1KE0 AVSEFFNASCVPVNNPKNYPSSLCALCVGDEQGRNKCVGNSQERYYGYRGAFRCLVENAG .:::. .:.: .. :. :::: ::.:. : : : :..: :::: ::::::::. : CCDS30 -FDEFFSEGCAP-GSKKD--SSLCKLCMGS--GLNLCEPNNKEGYYGYTGAFRCLVEK-G 500 510 520 530 540 570 580 590 600 610 620 pF1KE0 DVAFVRHTTVFDNTNGHNSEPWAAELRSEDYELLCPNGARAEVSQFAACNLAQIPPHAVM :::::.: :: .::.:.: .::: .: .:::::: .:.: : ..: :.::. : :::. CCDS30 DVAFVKHQTVPQNTGGKNPDPWAKNLNEKDYELLCLDGTRKPVEEYANCHLARAPNHAVV 550 560 570 580 590 600 630 640 650 660 670 680 pF1KE0 VRPDTNIFTVYGLLDKAQDLFGDD--HNKNGFKMFDSSNYHGQDLLFKDATVRAVPVGEK .: : . :. .: . : :::.. ...: .: : . .::::.: :: . . .. CCDS30 TRKDKEA-CVHKILRQQQHLFGSNVTDCSGNFCLFRSET---KDLLFRDDTVCLAKLHDR 610 620 630 640 650 660 690 700 710 720 730 pF1KE0 TTYRGWLGLDYVAALEGMSSQQCSGAAAPAPGAPLLPLLLPALAARLLPPAL .::. .:: .:: :. .. ..:: CCDS30 NTYEKYLGEEYVKAVGNL--RKCSTSSLLEACTFRRP 670 680 690 >-- initn: 684 init1: 211 opt: 527 Z-score: 637.8 bits: 128.6 E(32554): 3.3e-29 Smith-Waterman score: 766; 42.9% identity (68.7% similar) in 319 aa overlap (1-308:1-298) 10 20 30 40 50 pF1KE0 MRGPSGALWL--LLALRTVLGGMEVRWCATSDPEQHKCGNMSEAFREA--GIQPSLLCVR :: ::: . .:.: .. :::::.:. : :: .. . .. . . ::. ::. CCDS30 MRLAVGALLVCAVLGLCLAVPDKTVRWCAVSEHEATKCQSFRDHMKSVIPSDGPSVACVK 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE0 GTSADHCVQLIAAQEADAITLDGGAIYEAG-KEHGLKPVVGEVYD--QEVGTSYYAVAVV .: :.. :::.::::.:::.: .:.: ..:::::.: : .. : ::::::: CCDS30 KASYLDCIRAIAANEADAVTLDAGLVYDAYLAPNNLKPVVAEFYGSKEDPQTFYYAVAVV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE0 RRSSHVTIDTLKGVKSCHTGINRTVGWNVPVGYLVESGRLSVMGCDVLKAVSDYFGGSCV ...: .. :.: ::::::..:..:::.:.: : . : . :::...:.:::. CCDS30 KKDSGFQMNQLRGKKSCHTGLGRSAGWNIPIGLLYCD--LPEPRKPLEKAVANFFSGSCA 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 PGAGETSYSESLCRLCRGDSSGEGVCDKSPLERYYDYSGAFRCLAEGAGDVAFVKHSTVL : : :.. . ::.:: : : : :..:. :::::.:: .::::::::::::.. CCDS30 PCADGTDFPQ-LCQLCPG-------CGCSTLNQYFGYSGAFKCLKDGAGDVAFVKHSTIF 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 ENTDGKTLPSWGQALLSQD-FELLCRDGSRADVTEWRQCHLARVPAHAVVVRADTDGG-- :: .:. ..: .:::: :..: : :...::::.::.:.::.: . :: CCDS30 ENLANKA---------DRDQYELLCLDNTRKPVDEYKDCHLAQVPSHTVVAR--SMGGKE 240 250 260 270 300 310 320 330 340 pF1KE0 -LIFRLLNEGQRLFSHEGSSFQMFSSEAYGQKDLLFKDSTSELVPIATQTYEAWLGHEYL ::..:::..:. :... : CCDS30 DLIWELLNQAQEHFGKDKSKEFQLFSSPHGKDLLFKDSAHGFLKVPPRMDAKMYLGYEYV 280 290 300 310 320 330 738 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 04:37:44 2016 done: Fri Nov 4 04:37:45 2016 Total Scan time: 3.950 Total Display time: 0.120 Function used was FASTA [36.3.4 Apr, 2011]