FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA0899, 939 aa 1>>>pF1KSDA0899 939 - 939 aa - 939 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.4923+/-0.00107; mu= 7.9281+/- 0.065 mean_var=158.3530+/-32.780, 0's: 0 Z-trim(109.3): 18 B-trim: 134 in 1/50 Lambda= 0.101920 statistics sampled from 10791 (10804) to 10791 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.666), E-opt: 0.2 (0.332), width: 16 Scan time: 4.980 The best scores are: opt bits E(32554) CCDS44512.1 AP2A2 gene_id:161|Hs108|chr11 ( 939) 6089 907.8 0 CCDS73234.1 AP2A2 gene_id:161|Hs108|chr11 ( 940) 6077 906.0 0 CCDS46149.1 AP2A1 gene_id:160|Hs108|chr19 ( 955) 3966 595.6 1.5e-169 CCDS46148.1 AP2A1 gene_id:160|Hs108|chr19 ( 977) 3966 595.6 1.5e-169 CCDS45522.1 AP1G1 gene_id:164|Hs108|chr16 ( 825) 530 90.4 1.6e-17 CCDS32480.1 AP1G1 gene_id:164|Hs108|chr16 ( 822) 524 89.5 2.9e-17 CCDS9602.1 AP1G2 gene_id:8906|Hs108|chr14 ( 785) 435 76.4 2.4e-13 >>CCDS44512.1 AP2A2 gene_id:161|Hs108|chr11 (939 aa) initn: 6089 init1: 6089 opt: 6089 Z-score: 4844.9 bits: 907.8 E(32554): 0 Smith-Waterman score: 6089; 100.0% identity (100.0% similar) in 939 aa overlap (1-939:1-939) 10 20 30 40 50 60 pF1KSD MPAVSKGDGMRGLAVFISDIRNCKSKEAEIKRINKELANIRSKFKGDKALDGYSKKKYVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MPAVSKGDGMRGLAVFISDIRNCKSKEAEIKRINKELANIRSKFKGDKALDGYSKKKYVC 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD KLLFIFLLGHDIDFGHMEAVNLLSSNRYTEKQIGYLFISVLVNSNSELIRLINNAIKNDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 KLLFIFLLGHDIDFGHMEAVNLLSSNRYTEKQIGYLFISVLVNSNSELIRLINNAIKNDL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD ASRNPTFMGLALHCIASVGSREMAEAFAGEIPKVLVAGDTMDSVKQSAALCLLRLYRTSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 ASRNPTFMGLALHCIASVGSREMAEAFAGEIPKVLVAGDTMDSVKQSAALCLLRLYRTSP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD DLVPMGDWTSRVVHLLNDQHLGVVTAATSLITTLAQKNPEEFKTSVSLAVSRLSRIVTSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 DLVPMGDWTSRVVHLLNDQHLGVVTAATSLITTLAQKNPEEFKTSVSLAVSRLSRIVTSA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD STDLQDYTYYFVPAPWLSVKLLRLLQCYPPPDPAVRGRLTECLETILNKAQEPPKSKKVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 STDLQDYTYYFVPAPWLSVKLLRLLQCYPPPDPAVRGRLTECLETILNKAQEPPKSKKVQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD HSNAKNAVLFEAISLIIHHDSEPNLLVRACNQLGQFLQHRETNLRYLALESMCTLASSEF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 HSNAKNAVLFEAISLIIHHDSEPNLLVRACNQLGQFLQHRETNLRYLALESMCTLASSEF 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD SHEAVKTHIETVINALKTERDVSVRQRAVDLLYAMCDRSNAPQIVAEMLSYLETADYSIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 SHEAVKTHIETVINALKTERDVSVRQRAVDLLYAMCDRSNAPQIVAEMLSYLETADYSIR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD EEIVLKVAILAEKYAVDYTWYVDTILNLIRIAGDYVSEEVWYRVIQIVINRDDVQGYAAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 EEIVLKVAILAEKYAVDYTWYVDTILNLIRIAGDYVSEEVWYRVIQIVINRDDVQGYAAK 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD TVFEALQAPACHENLVKVGGYILGEFGNLIAGDPRSSPLIQFHLLHSKFHLCSVPTRALL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 TVFEALQAPACHENLVKVGGYILGEFGNLIAGDPRSSPLIQFHLLHSKFHLCSVPTRALL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD LSTYIKFVNLFPEVKPTIQDVLRSDSQLRNADVELQQRAVEYLRLSTVASTDILATVLEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 LSTYIKFVNLFPEVKPTIQDVLRSDSQLRNADVELQQRAVEYLRLSTVASTDILATVLEE 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD MPPFPERESSILAKLKKKKGPSTVTDLEDTKRDRSVDVNGGPEPAPASTSAVSTPSPSAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MPPFPERESSILAKLKKKKGPSTVTDLEDTKRDRSVDVNGGPEPAPASTSAVSTPSPSAD 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD LLGLGAAPPAPAGPPPSSGGSGLLVDVFSDSASVVAPLAPGSEDNFARFVCKNNGVLFEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 LLGLGAAPPAPAGPPPSSGGSGLLVDVFSDSASVVAPLAPGSEDNFARFVCKNNGVLFEN 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD QLLQIGLKSEFRQNLGRMFIFYGNKTSTQFLNFTPTLICSDDLQPNLNLQTKPVDPTVEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 QLLQIGLKSEFRQNLGRMFIFYGNKTSTQFLNFTPTLICSDDLQPNLNLQTKPVDPTVEG 730 740 750 760 770 780 790 800 810 820 830 840 pF1KSD GAQVQQVVNIECVSDFTEAPVLNIQFRYGGTFQNVSVQLPITLNKFFQPTEMASQDFFQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 GAQVQQVVNIECVSDFTEAPVLNIQFRYGGTFQNVSVQLPITLNKFFQPTEMASQDFFQR 790 800 810 820 830 840 850 860 870 880 890 900 pF1KSD WKQLSNPQQEVQNIFKAKHPMDTEVTKAKIIGFGSALLEEVDPNPANFVGAGIIHTKTTQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 WKQLSNPQQEVQNIFKAKHPMDTEVTKAKIIGFGSALLEEVDPNPANFVGAGIIHTKTTQ 850 860 870 880 890 900 910 920 930 pF1KSD IGCLLRLEPNLQAQMYRLTLRTSKEAVSQRLCELLSAQF ::::::::::::::::::::::::::::::::::::::: CCDS44 IGCLLRLEPNLQAQMYRLTLRTSKEAVSQRLCELLSAQF 910 920 930 >>CCDS73234.1 AP2A2 gene_id:161|Hs108|chr11 (940 aa) initn: 4362 init1: 4362 opt: 6077 Z-score: 4835.3 bits: 906.0 E(32554): 0 Smith-Waterman score: 6077; 99.9% identity (99.9% similar) in 940 aa overlap (1-939:1-940) 10 20 30 40 50 60 pF1KSD MPAVSKGDGMRGLAVFISDIRNCKSKEAEIKRINKELANIRSKFKGDKALDGYSKKKYVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 MPAVSKGDGMRGLAVFISDIRNCKSKEAEIKRINKELANIRSKFKGDKALDGYSKKKYVC 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD KLLFIFLLGHDIDFGHMEAVNLLSSNRYTEKQIGYLFISVLVNSNSELIRLINNAIKNDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 KLLFIFLLGHDIDFGHMEAVNLLSSNRYTEKQIGYLFISVLVNSNSELIRLINNAIKNDL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD ASRNPTFMGLALHCIASVGSREMAEAFAGEIPKVLVAGDTMDSVKQSAALCLLRLYRTSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 ASRNPTFMGLALHCIASVGSREMAEAFAGEIPKVLVAGDTMDSVKQSAALCLLRLYRTSP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD DLVPMGDWTSRVVHLLNDQHLGVVTAATSLITTLAQKNPEEFKTSVSLAVSRLSRIVTSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 DLVPMGDWTSRVVHLLNDQHLGVVTAATSLITTLAQKNPEEFKTSVSLAVSRLSRIVTSA 190 200 210 220 230 240 250 260 270 280 290 pF1KSD STDLQDYTYYFVPAPWLSVKLLRLLQCYPPP-DPAVRGRLTECLETILNKAQEPPKSKKV ::::::::::::::::::::::::::::::: :::::::::::::::::::::::::::: CCDS73 STDLQDYTYYFVPAPWLSVKLLRLLQCYPPPEDPAVRGRLTECLETILNKAQEPPKSKKV 250 260 270 280 290 300 300 310 320 330 340 350 pF1KSD QHSNAKNAVLFEAISLIIHHDSEPNLLVRACNQLGQFLQHRETNLRYLALESMCTLASSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 QHSNAKNAVLFEAISLIIHHDSEPNLLVRACNQLGQFLQHRETNLRYLALESMCTLASSE 310 320 330 340 350 360 360 370 380 390 400 410 pF1KSD FSHEAVKTHIETVINALKTERDVSVRQRAVDLLYAMCDRSNAPQIVAEMLSYLETADYSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 FSHEAVKTHIETVINALKTERDVSVRQRAVDLLYAMCDRSNAPQIVAEMLSYLETADYSI 370 380 390 400 410 420 420 430 440 450 460 470 pF1KSD REEIVLKVAILAEKYAVDYTWYVDTILNLIRIAGDYVSEEVWYRVIQIVINRDDVQGYAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 REEIVLKVAILAEKYAVDYTWYVDTILNLIRIAGDYVSEEVWYRVIQIVINRDDVQGYAA 430 440 450 460 470 480 480 490 500 510 520 530 pF1KSD KTVFEALQAPACHENLVKVGGYILGEFGNLIAGDPRSSPLIQFHLLHSKFHLCSVPTRAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 KTVFEALQAPACHENLVKVGGYILGEFGNLIAGDPRSSPLIQFHLLHSKFHLCSVPTRAL 490 500 510 520 530 540 540 550 560 570 580 590 pF1KSD LLSTYIKFVNLFPEVKPTIQDVLRSDSQLRNADVELQQRAVEYLRLSTVASTDILATVLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 LLSTYIKFVNLFPEVKPTIQDVLRSDSQLRNADVELQQRAVEYLRLSTVASTDILATVLE 550 560 570 580 590 600 600 610 620 630 640 650 pF1KSD EMPPFPERESSILAKLKKKKGPSTVTDLEDTKRDRSVDVNGGPEPAPASTSAVSTPSPSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 EMPPFPERESSILAKLKKKKGPSTVTDLEDTKRDRSVDVNGGPEPAPASTSAVSTPSPSA 610 620 630 640 650 660 660 670 680 690 700 710 pF1KSD DLLGLGAAPPAPAGPPPSSGGSGLLVDVFSDSASVVAPLAPGSEDNFARFVCKNNGVLFE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 DLLGLGAAPPAPAGPPPSSGGSGLLVDVFSDSASVVAPLAPGSEDNFARFVCKNNGVLFE 670 680 690 700 710 720 720 730 740 750 760 770 pF1KSD NQLLQIGLKSEFRQNLGRMFIFYGNKTSTQFLNFTPTLICSDDLQPNLNLQTKPVDPTVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 NQLLQIGLKSEFRQNLGRMFIFYGNKTSTQFLNFTPTLICSDDLQPNLNLQTKPVDPTVE 730 740 750 760 770 780 780 790 800 810 820 830 pF1KSD GGAQVQQVVNIECVSDFTEAPVLNIQFRYGGTFQNVSVQLPITLNKFFQPTEMASQDFFQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 GGAQVQQVVNIECVSDFTEAPVLNIQFRYGGTFQNVSVQLPITLNKFFQPTEMASQDFFQ 790 800 810 820 830 840 840 850 860 870 880 890 pF1KSD RWKQLSNPQQEVQNIFKAKHPMDTEVTKAKIIGFGSALLEEVDPNPANFVGAGIIHTKTT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 RWKQLSNPQQEVQNIFKAKHPMDTEVTKAKIIGFGSALLEEVDPNPANFVGAGIIHTKTT 850 860 870 880 890 900 900 910 920 930 pF1KSD QIGCLLRLEPNLQAQMYRLTLRTSKEAVSQRLCELLSAQF :::::::::::::::::::::::::::::::::::::::: CCDS73 QIGCLLRLEPNLQAQMYRLTLRTSKEAVSQRLCELLSAQF 910 920 930 940 >>CCDS46149.1 AP2A1 gene_id:160|Hs108|chr19 (955 aa) initn: 3452 init1: 2151 opt: 3966 Z-score: 3157.7 bits: 595.6 E(32554): 1.5e-169 Smith-Waterman score: 5113; 82.2% identity (92.2% similar) in 959 aa overlap (1-939:1-955) 10 20 30 40 50 60 pF1KSD MPAVSKGDGMRGLAVFISDIRNCKSKEAEIKRINKELANIRSKFKGDKALDGYSKKKYVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 MPAVSKGDGMRGLAVFISDIRNCKSKEAEIKRINKELANIRSKFKGDKALDGYSKKKYVC 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD KLLFIFLLGHDIDFGHMEAVNLLSSNRYTEKQIGYLFISVLVNSNSELIRLINNAIKNDL ::::::::::::::::::::::::::.::::::::::::::::::::::::::::::::: CCDS46 KLLFIFLLGHDIDFGHMEAVNLLSSNKYTEKQIGYLFISVLVNSNSELIRLINNAIKNDL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD ASRNPTFMGLALHCIASVGSREMAEAFAGEIPKVLVAGDTMDSVKQSAALCLLRLYRTSP :::::::: :::::::.::::::.::::..::..:::::.::::::::::::::::..:: CCDS46 ASRNPTFMCLALHCIANVGSREMGEAFAADIPRILVAGDSMDSVKQSAALCLLRLYKASP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD DLVPMGDWTSRVVHLLNDQHLGVVTAATSLITTLAQKNPEEFKTSVSLAVSRLSRIVTSA ::::::.::.::::::::::.::::::.:::: : .:::..::: ::::::::::::.:: CCDS46 DLVPMGEWTARVVHLLNDQHMGVVTAAVSLITCLCKKNPDDFKTCVSLAVSRLSRIVSSA 190 200 210 220 230 240 250 260 270 280 290 pF1KSD STDLQDYTYYFVPAPWLSVKLLRLLQCYPPP-DPAVRGRLTECLETILNKAQEPPKSKKV ::::::::::::::::::::::::::::::: : ::.:::.:::::.::::::::::::: CCDS46 STDLQDYTYYFVPAPWLSVKLLRLLQCYPPPEDAAVKGRLVECLETVLNKAQEPPKSKKV 250 260 270 280 290 300 300 310 320 330 340 350 pF1KSD QHSNAKNAVLFEAISLIIHHDSEPNLLVRACNQLGQFLQHRETNLRYLALESMCTLASSE ::::::::.:::.::::::.:::::::::::::::::::::::::::::::::::::::: CCDS46 QHSNAKNAILFETISLIIHYDSEPNLLVRACNQLGQFLQHRETNLRYLALESMCTLASSE 310 320 330 340 350 360 360 370 380 390 400 410 pF1KSD FSHEAVKTHIETVINALKTERDVSVRQRAVDLLYAMCDRSNAPQIVAEMLSYLETADYSI ::::::::::.::::::::::::::::::.:::::::::::: :::.::: :::::::.: CCDS46 FSHEAVKTHIDTVINALKTERDVSVRQRAADLLYAMCDRSNAKQIVSEMLRYLETADYAI 370 380 390 400 410 420 420 430 440 450 460 470 pF1KSD REEIVLKVAILAEKYAVDYTWYVDTILNLIRIAGDYVSEEVWYRVIQIVINRDDVQGYAA :::::::::::::::::::.:::::::::::::::::::::::::.::: :::::::::: CCDS46 REEIVLKVAILAEKYAVDYSWYVDTILNLIRIAGDYVSEEVWYRVLQIVTNRDDVQGYAA 430 440 450 460 470 480 480 490 500 510 520 530 pF1KSD KTVFEALQAPACHENLVKVGGYILGEFGNLIAGDPRSSPLIQFHLLHSKFHLCSVPTRAL :::::::::::::::.::::::::::::::::::::::: .:: ::::::::::: :::: CCDS46 KTVFEALQAPACHENMVKVGGYILGEFGNLIAGDPRSSPPVQFSLLHSKFHLCSVATRAL 490 500 510 520 530 540 540 550 560 570 580 590 pF1KSD LLSTYIKFVNLFPEVKPTIQDVLRSDSQLRNADVELQQRAVEYLRLSTVASTDILATVLE ::::::::.:::::.: ::: :::. :::::::::::::::::: ::.:::::.:::::: CCDS46 LLSTYIKFINLFPETKATIQGVLRAGSQLRNADVELQQRAVEYLTLSSVASTDVLATVLE 550 560 570 580 590 600 600 610 620 630 640 650 pF1KSD EMPPFPERESSILAKLKKKKGPSTVTDLEDTKRD-RSVDVNGGPEPAPASTSAVSTPSPS :::::::::::::::::.::::.. . :.: .:: : :.::: ::.: :.::::::: CCDS46 EMPPFPERESSILAKLKRKKGPGAGSALDDGRRDPSSNDINGGMEPTP---STVSTPSPS 610 620 630 640 650 660 670 680 690 700 pF1KSD ADLLGLGAAPPAPAGPPPSSGGSGLLVDVFSDSAS--VVAP------LAPGSEDN----- :::::: :::: ::.:: :.:...::::::. :. ..: :.:: :: CCDS46 ADLLGLRAAPP-PAAPPASAGAGNLLVDVFDGPAAQPSLGPTPEEAFLSPGPEDIGPPIP 660 670 680 690 700 710 710 720 730 740 750 760 pF1KSD -----FARFVCKNNGVLFENQLLQIGLKSEFRQNLGRMFIFYGNKTSTQFLNFTPTLICS . .::::::::::::::::::.:::::::::::..:::::::.:: ::.::.. CCDS46 EADELLNKFVCKNNGVLFENQLLQIGVKSEFRQNLGRMYLFYGNKTSVQFQNFSPTVVHP 720 730 740 750 760 770 770 780 790 800 810 820 pF1KSD DDLQPNLNLQTKPVDPTVEGGAQVQQVVNIECVSDFTEAPVLNIQFRYGGTFQNVSVQLP ::: .: .::: : :.::::::::.::::. :: :.:...:::::. : ....:: CCDS46 GDLQTQLAVQTKRVAAQVDGGAQVQQVLNIECLRDFLTPPLLSVRFRYGGAPQALTLKLP 780 790 800 810 820 830 830 840 850 860 870 880 pF1KSD ITLNKFFQPTEMASQDFFQRWKQLSNPQQEVQNIFKAKHPMDTEVTKAKIIGFGSALLEE .:.::::::::::.::::::::::: ::::.:.::::.::::.::::::..:::::::.. CCDS46 VTINKFFQPTEMAAQDFFQRWKQLSLPQQEAQKIFKANHPMDAEVTKAKLLGFGSALLDN 840 850 860 870 880 890 890 900 910 920 930 pF1KSD VDPNPANFVGAGIIHTKTTQIGCLLRLEPNLQAQMYRLTLRTSKEAVSQRLCELLSAQF ::::: ::::::::.::. :.::::::::: :::::::::::::: ::..:::::. :: CCDS46 VDPNPENFVGAGIIQTKALQVGCLLRLEPNAQAQMYRLTLRTSKEPVSRHLCELLAQQF 900 910 920 930 940 950 >>CCDS46148.1 AP2A1 gene_id:160|Hs108|chr19 (977 aa) initn: 3444 init1: 2151 opt: 3966 Z-score: 3157.5 bits: 595.6 E(32554): 1.5e-169 Smith-Waterman score: 5047; 80.4% identity (90.1% similar) in 976 aa overlap (1-934:1-972) 10 20 30 40 50 60 pF1KSD MPAVSKGDGMRGLAVFISDIRNCKSKEAEIKRINKELANIRSKFKGDKALDGYSKKKYVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 MPAVSKGDGMRGLAVFISDIRNCKSKEAEIKRINKELANIRSKFKGDKALDGYSKKKYVC 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD KLLFIFLLGHDIDFGHMEAVNLLSSNRYTEKQIGYLFISVLVNSNSELIRLINNAIKNDL ::::::::::::::::::::::::::.::::::::::::::::::::::::::::::::: CCDS46 KLLFIFLLGHDIDFGHMEAVNLLSSNKYTEKQIGYLFISVLVNSNSELIRLINNAIKNDL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD ASRNPTFMGLALHCIASVGSREMAEAFAGEIPKVLVAGDTMDSVKQSAALCLLRLYRTSP :::::::: :::::::.::::::.::::..::..:::::.::::::::::::::::..:: CCDS46 ASRNPTFMCLALHCIANVGSREMGEAFAADIPRILVAGDSMDSVKQSAALCLLRLYKASP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD DLVPMGDWTSRVVHLLNDQHLGVVTAATSLITTLAQKNPEEFKTSVSLAVSRLSRIVTSA ::::::.::.::::::::::.::::::.:::: : .:::..::: ::::::::::::.:: CCDS46 DLVPMGEWTARVVHLLNDQHMGVVTAAVSLITCLCKKNPDDFKTCVSLAVSRLSRIVSSA 190 200 210 220 230 240 250 260 270 280 290 pF1KSD STDLQDYTYYFVPAPWLSVKLLRLLQCYPPP-DPAVRGRLTECLETILNKAQEPPKSKKV ::::::::::::::::::::::::::::::: : ::.:::.:::::.::::::::::::: CCDS46 STDLQDYTYYFVPAPWLSVKLLRLLQCYPPPEDAAVKGRLVECLETVLNKAQEPPKSKKV 250 260 270 280 290 300 300 310 320 330 340 350 pF1KSD QHSNAKNAVLFEAISLIIHHDSEPNLLVRACNQLGQFLQHRETNLRYLALESMCTLASSE ::::::::.:::.::::::.:::::::::::::::::::::::::::::::::::::::: CCDS46 QHSNAKNAILFETISLIIHYDSEPNLLVRACNQLGQFLQHRETNLRYLALESMCTLASSE 310 320 330 340 350 360 360 370 380 390 400 410 pF1KSD FSHEAVKTHIETVINALKTERDVSVRQRAVDLLYAMCDRSNAPQIVAEMLSYLETADYSI ::::::::::.::::::::::::::::::.:::::::::::: :::.::: :::::::.: CCDS46 FSHEAVKTHIDTVINALKTERDVSVRQRAADLLYAMCDRSNAKQIVSEMLRYLETADYAI 370 380 390 400 410 420 420 430 440 450 460 470 pF1KSD REEIVLKVAILAEKYAVDYTWYVDTILNLIRIAGDYVSEEVWYRVIQIVINRDDVQGYAA :::::::::::::::::::.:::::::::::::::::::::::::.::: :::::::::: CCDS46 REEIVLKVAILAEKYAVDYSWYVDTILNLIRIAGDYVSEEVWYRVLQIVTNRDDVQGYAA 430 440 450 460 470 480 480 490 500 510 520 530 pF1KSD KTVFEALQAPACHENLVKVGGYILGEFGNLIAGDPRSSPLIQFHLLHSKFHLCSVPTRAL :::::::::::::::.::::::::::::::::::::::: .:: ::::::::::: :::: CCDS46 KTVFEALQAPACHENMVKVGGYILGEFGNLIAGDPRSSPPVQFSLLHSKFHLCSVATRAL 490 500 510 520 530 540 540 550 560 570 580 590 pF1KSD LLSTYIKFVNLFPEVKPTIQDVLRSDSQLRNADVELQQRAVEYLRLSTVASTDILATVLE ::::::::.:::::.: ::: :::. :::::::::::::::::: ::.:::::.:::::: CCDS46 LLSTYIKFINLFPETKATIQGVLRAGSQLRNADVELQQRAVEYLTLSSVASTDVLATVLE 550 560 570 580 590 600 600 610 620 630 640 650 pF1KSD EMPPFPERESSILAKLKKKKGPSTVTDLEDTKRD-RSVDVNGGPEPAPASTSAVSTPSPS :::::::::::::::::.::::.. . :.: .:: : :.::: ::.: :.::::::: CCDS46 EMPPFPERESSILAKLKRKKGPGAGSALDDGRRDPSSNDINGGMEPTP---STVSTPSPS 610 620 630 640 650 660 670 680 690 pF1KSD ADLLGLGAAPPAPAGPPPSSGGSGLLVDVFSDSASVVA--------------------PL :::::: :::: ::.:: :.:...::::::. :. . :. CCDS46 ADLLGLRAAPP-PAAPPASAGAGNLLVDVFDGPAAQPSLGPTPEEAFLSELEPPAPESPM 660 670 680 690 700 710 700 710 720 730 pF1KSD A----------PGSEDN----------FARFVCKNNGVLFENQLLQIGLKSEFRQNLGRM : :: :: . .::::::::::::::::::.::::::::::: CCDS46 ALLADPAPAADPGPEDIGPPIPEADELLNKFVCKNNGVLFENQLLQIGVKSEFRQNLGRM 720 730 740 750 760 770 740 750 760 770 780 790 pF1KSD FIFYGNKTSTQFLNFTPTLICSDDLQPNLNLQTKPVDPTVEGGAQVQQVVNIECVSDFTE ..:::::::.:: ::.::.. ::: .: .::: : :.::::::::.::::. :: CCDS46 YLFYGNKTSVQFQNFSPTVVHPGDLQTQLAVQTKRVAAQVDGGAQVQQVLNIECLRDFLT 780 790 800 810 820 830 800 810 820 830 840 850 pF1KSD APVLNIQFRYGGTFQNVSVQLPITLNKFFQPTEMASQDFFQRWKQLSNPQQEVQNIFKAK :.:...:::::. : ....::.:.::::::::::.::::::::::: ::::.:.::::. CCDS46 PPLLSVRFRYGGAPQALTLKLPVTINKFFQPTEMAAQDFFQRWKQLSLPQQEAQKIFKAN 840 850 860 870 880 890 860 870 880 890 900 910 pF1KSD HPMDTEVTKAKIIGFGSALLEEVDPNPANFVGAGIIHTKTTQIGCLLRLEPNLQAQMYRL ::::.::::::..:::::::..::::: ::::::::.::. :.::::::::: ::::::: CCDS46 HPMDAEVTKAKLLGFGSALLDNVDPNPENFVGAGIIQTKALQVGCLLRLEPNAQAQMYRL 900 910 920 930 940 950 920 930 pF1KSD TLRTSKEAVSQRLCELLSAQF ::::::: ::..:::: CCDS46 TLRTSKEPVSRHLCELLAQQF 960 970 >>CCDS45522.1 AP1G1 gene_id:164|Hs108|chr16 (825 aa) initn: 730 init1: 260 opt: 530 Z-score: 428.2 bits: 90.4 E(32554): 1.6e-17 Smith-Waterman score: 951; 30.0% identity (61.5% similar) in 716 aa overlap (16-702:10-680) 10 20 30 40 50 60 pF1KSD MPAVSKGDGMRGLAVFISDIRNCKSKEAEIKRINKELANIRSKFKGDKALDGYSKKKYVC .: ::. ... : . :.:: : :::.:. . :. . . : CCDS45 MPAPIRLRELIRTIRTARTQAEEREMIQKECAAIRSSFREE---DNTYRCRNVA 10 20 30 40 50 70 80 90 100 110 120 pF1KSD KLLFIFLLGHDIDFGHMEAVNLLSSNRYTEKQIGYLFISVLVNSNSELIRLINNAIKNDL :::.. .::. ::..: ..:..:...:.:.:::: .:.. ... :..: ::::: CCDS45 KLLYMHMLGYPAHFGQLECLKLIASQKFTDKRIGYLGAMLLLDERQDVHLLMTNCIKNDL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KSD ASRNPTFMGLALHCIASVGSREMAEAFAGEIPKVLVAGDTMDSVKQSAALCLLRLYRTSP . .:::: .. .:: :: . .:::. :.: ..... ....:::: ... : : CCDS45 NHSTQFVQGLALCTLGCMGSSEMCRDLAGEVEKLLKTSNSY--LRKKAALCAVHVIRKVP 120 130 140 150 160 190 200 210 220 230 pF1KSD DLVPMGDWTSRVVHLLNDQHLGVVTAATSLITTLAQKNPE---EFKTSVSLAVSRLSRI- .:. : . . .:::... ::. ... :.: . ...:. .:. . .: : .: :: CCDS45 ELMEM--FLPATKNLLNEKNHGVLHTSVVLLTEMCERSPDMLAHFRKNEKL-VPQLVRIL 170 180 190 200 210 220 240 250 260 270 280 290 pF1KSD ---VTSASTDLQDYTYYFVPAPWLSVKLLRLLQCYPPPDPAVRGRLTECLETILNKAQEP . :. . .: . . :.:.:..::::. : .: .. :: .. CCDS45 KNLIMSGYSPEHDVSG--ISDPFLQVRILRLLRILGRNDDDS----SEAMNDILAQVATN 230 240 250 260 270 280 300 310 320 330 340 350 pF1KSD PKSKKVQHSNAKNAVLFEAISLIIHHDSEPNLLVRACNQLGQFLQHRETNLRYLALESMC ...: :. ::.:.:.. :. :: .: : : : ::.:: . . :.::.:: :. CCDS45 TETSK----NVGNAILYETVLTIMDIKSESGLRVLAINILGRFLLNNDKNIRYVALTSL- 290 300 310 320 330 360 370 380 390 400 410 pF1KSD TLASSEFSHEAVKTHIETVINALKTERDVSVRQRAVDLLYAMCDRSNAPQIVAEMLSYLE : . . .:.::. : :... :: . :::...::..: .:. . .: .. :.: .:. CCDS45 -LKTVQTDHNAVQRHRSTIVDCLK-DLDVSIKRRAMELSFALVNGNNIRGMMKELLYFLD 340 350 360 370 380 390 420 430 440 450 460 470 pF1KSD TADYSIREEIVLKVAILAEKYAVDYTWYVDTILNLIRIAGDYVSEEVWYRVIQIVINRDD . . .. . . . . ::::: . :..:::. .. ::.:: ... .::.. : . CCDS45 SCEPEFKADCASGIFLAAEKYAPSKRWHIDTIMRVLTTAGSYVRDDAVPNLIQLITNSVE 400 410 420 430 440 450 480 490 500 510 520 pF1KSD VQGYAAKTVFEALQAPACHENLVKVGGYILGEFGNL-IAGDPRSSPLIQ------FHLLH ...:... ...:. . .. ::.:... .::.:.: ..:. . :: . .:. CCDS45 MHAYTVQRLYKAILGDYSQQPLVQVAAWCIGEYGDLLVSGQCEEEEPIQVTEDEVLDILE 460 470 480 490 500 510 530 540 550 560 570 580 pF1KSD SKF--HLCSVPTRALLLSTYIKFVNLFPEVKPTIQDVLRSDSQLRNADVELQQRAVEYLR : . .. . ::. :.. .:. . : . :. :. .. . ::::::::::: CCDS45 SVLISNMSTSVTRGYALTAIMKLSTRFTCTVNRIKKVVSIYGS--SIDVELQQRAVEYNA 520 530 540 550 560 570 590 600 610 620 630 640 pF1KSD LSTVASTDILATVLEEMPPFPERESSILAKLKKKKGPSTVTDLEDTKRDRSVDVNGGPEP : . : . ..: : : :. .. .::. . :..:: :: CCDS45 L--FKKYDHMRSALLERMPVMEKVTT--------NGPTEI-----------VQTNGETEP 580 590 600 610 650 660 670 680 690 pF1KSD APASTSAV-STPSPSA------DLLG----LGAAPPAPAGPPPSSGGS--GLLVDVFSDS :: :. : :.:.. :::: . : ::.. : :.:: :: :. . CCDS45 APLETKPPPSGPQPTSQANDLLDLLGGNDITPVIPTAPTSKPSSAGGELLDLLGDINLTG 620 630 640 650 660 670 700 710 720 730 740 750 pF1KSD ASVVAPLAPGSEDNFARFVCKNNGVLFENQLLQIGLKSEFRQNLGRMFIFYGNKTSTQFL : ..:: ::.: CCDS45 APAAAP-APASVPQISQPPFLLDGLSSQPLFNDIAAGIPSITAYSKNGLKIEFTFERSNT 680 690 700 710 720 >>CCDS32480.1 AP1G1 gene_id:164|Hs108|chr16 (822 aa) initn: 730 init1: 260 opt: 524 Z-score: 423.4 bits: 89.5 E(32554): 2.9e-17 Smith-Waterman score: 961; 29.9% identity (61.4% similar) in 712 aa overlap (16-702:10-677) 10 20 30 40 50 60 pF1KSD MPAVSKGDGMRGLAVFISDIRNCKSKEAEIKRINKELANIRSKFKGDKALDGYSKKKYVC .: ::. ... : . :.:: : :::.:. . :. . . : CCDS32 MPAPIRLRELIRTIRTARTQAEEREMIQKECAAIRSSFREE---DNTYRCRNVA 10 20 30 40 50 70 80 90 100 110 120 pF1KSD KLLFIFLLGHDIDFGHMEAVNLLSSNRYTEKQIGYLFISVLVNSNSELIRLINNAIKNDL :::.. .::. ::..: ..:..:...:.:.:::: .:.. ... :..: ::::: CCDS32 KLLYMHMLGYPAHFGQLECLKLIASQKFTDKRIGYLGAMLLLDERQDVHLLMTNCIKNDL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KSD ASRNPTFMGLALHCIASVGSREMAEAFAGEIPKVLVAGDTMDSVKQSAALCLLRLYRTSP . .:::: .. .:: :: . .:::. :.: ..... ....:::: ... : : CCDS32 NHSTQFVQGLALCTLGCMGSSEMCRDLAGEVEKLLKTSNSY--LRKKAALCAVHVIRKVP 120 130 140 150 160 190 200 210 220 230 pF1KSD DLVPMGDWTSRVVHLLNDQHLGVVTAATSLITTLAQKNPE---EFKTSVSLAVSRLSRIV .:. : . . .:::... ::. ... :.: . ...:. .:. : : :. .. CCDS32 ELMEM--FLPATKNLLNEKNHGVLHTSVVLLTEMCERSPDMLAHFRKLVPQLVRILKNLI 170 180 190 200 210 220 240 250 260 270 280 290 pF1KSD TSASTDLQDYTYYFVPAPWLSVKLLRLLQCYPPPDPAVRGRLTECLETILNKAQEPPKSK :. . .: . . :.:.:..::::. : .: .. :: .. ... CCDS32 MSGYSPEHDVSG--ISDPFLQVRILRLLRILGRNDDDS----SEAMNDILAQVATNTETS 230 240 250 260 270 280 300 310 320 330 340 350 pF1KSD KVQHSNAKNAVLFEAISLIIHHDSEPNLLVRACNQLGQFLQHRETNLRYLALESMCTLAS : :. ::.:.:.. :. :: .: : : : ::.:: . . :.::.:: :. : . CCDS32 K----NVGNAILYETVLTIMDIKSESGLRVLAINILGRFLLNNDKNIRYVALTSL--LKT 290 300 310 320 330 360 370 380 390 400 410 pF1KSD SEFSHEAVKTHIETVINALKTERDVSVRQRAVDLLYAMCDRSNAPQIVAEMLSYLETADY . .:.::. : :... :: . :::...::..: .:. . .: .. :.: .:.. . CCDS32 VQTDHNAVQRHRSTIVDCLK-DLDVSIKRRAMELSFALVNGNNIRGMMKELLYFLDSCEP 340 350 360 370 380 390 420 430 440 450 460 470 pF1KSD SIREEIVLKVAILAEKYAVDYTWYVDTILNLIRIAGDYVSEEVWYRVIQIVINRDDVQGY .. . . . . ::::: . :..:::. .. ::.:: ... .::.. : ....: CCDS32 EFKADCASGIFLAAEKYAPSKRWHIDTIMRVLTTAGSYVRDDAVPNLIQLITNSVEMHAY 400 410 420 430 440 450 480 490 500 510 520 pF1KSD AAKTVFEALQAPACHENLVKVGGYILGEFGNL-IAGDPRSSPLIQ------FHLLHSKF- ... ...:. . .. ::.:... .::.:.: ..:. . :: . .:.: . CCDS32 TVQRLYKAILGDYSQQPLVQVAAWCIGEYGDLLVSGQCEEEEPIQVTEDEVLDILESVLI 460 470 480 490 500 510 530 540 550 560 570 580 pF1KSD -HLCSVPTRALLLSTYIKFVNLFPEVKPTIQDVLRSDSQLRNADVELQQRAVEYLRLSTV .. . ::. :.. .:. . : . :. :. .. . ::::::::::: : CCDS32 SNMSTSVTRGYALTAIMKLSTRFTCTVNRIKKVVSIYGS--SIDVELQQRAVEYNAL--F 520 530 540 550 560 570 590 600 610 620 630 640 pF1KSD ASTDILATVLEEMPPFPERESSILAKLKKKKGPSTVTDLEDTKRDRSVDVNGGPEPAPAS . : . ..: : : :. .. .::. . :..:: :::: CCDS32 KKYDHMRSALLERMPVMEKVTT--------NGPTEI-----------VQTNGETEPAPLE 580 590 600 610 650 660 670 680 690 pF1KSD TSAV-STPSPSA------DLLG----LGAAPPAPAGPPPSSGGS--GLLVDVFSDSASVV :. : :.:.. :::: . : ::.. : :.:: :: :. .: .. CCDS32 TKPPPSGPQPTSQANDLLDLLGGNDITPVIPTAPTSKPSSAGGELLDLLGDINLTGAPAA 620 630 640 650 660 670 700 710 720 730 740 750 pF1KSD APLAPGSEDNFARFVCKNNGVLFENQLLQIGLKSEFRQNLGRMFIFYGNKTSTQFLNFTP :: ::.: CCDS32 AP-APASVPQISQPPFLLDGLSSQPLFNDIAAGIPSITAYSKNGLKIEFTFERSNTNPSV 680 690 700 710 720 730 >>CCDS9602.1 AP1G2 gene_id:8906|Hs108|chr14 (785 aa) initn: 689 init1: 246 opt: 435 Z-score: 353.0 bits: 76.4 E(32554): 2.4e-13 Smith-Waterman score: 885; 29.1% identity (58.4% similar) in 838 aa overlap (16-831:11-782) 10 20 30 40 50 60 pF1KSD MPAVSKGDGMRGLAVFISDIRNCKSKEAEIKRINKELANIRSKFKGDKALDGYSKKKYVC .: .::. :.. : . :.:: :.::..:. : ... . CCDS96 MVVPSLKLQDLIEEIRGAKTQAQEREVIQKECAHIRASFRDG---DPVHRHRQLA 10 20 30 40 50 70 80 90 100 110 120 pF1KSD KLLFIFLLGHDIDFGHMEAVNLLSSNRYTEKQIGYLFISVLVNSNSELIRLINNAIKNDL :::.. .::. ::.:: ..:..:.:.:.:..::: .:.. . ::.:.::::: CCDS96 KLLYVHMLGYPAHFGQMECLKLIASSRFTDKRVGYLGAMLLLDERHDAHLLITNSIKNDL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KSD ASRNPTFMGLALHCIASVGSREMAEAFAGEIPKVLVAGDTMDSVKQSAALCLLRLYRTSP .. .:::: ....:: :: . .: :. :.:. . . :...: : ... : : CCDS96 SQGIQPVQGLALCTLSTMGSAEMCRDLAPEVEKLLLQPSPY--VRKKAILTAVHMIRKVP 120 130 140 150 160 170 190 200 210 220 230 pF1KSD DLVPMGDWTSRVVHLLNDQHLGVVTAATSLITTLAQKNP---EEFKTSVSLAVSRLSRIV .: . . ..::...: :.. .. .::: : ...: ..:. : : : .: CCDS96 ELSSV--FLPPCAQLLHERHHGILLGTITLITELCERSPAALRHFRKVVPQLVHILRTLV 180 190 200 210 220 240 250 260 270 280 290 pF1KSD TSASTDLQDYTYYFVPAPWLSVKLLRLLQCYPPPDPAVRGRLTECLETILNKAQEPPKSK : . . ... : :.:.:..::::. . :: : .: .. CCDS96 TMGYS--TEHSISGVSDPFLQVQILRLLR--------ILGRNHEESSETMNDLLAQVATN 230 240 250 260 270 300 310 320 330 340 350 pF1KSD KVQHSNAKNAVLFEAISLIIHHDSEPNLLVRACNQLGQFLQHRETNLRYLALESMCTLAS :: ::::::.. :. : .: : : : ::.:: . . :.::.:: :. :.. CCDS96 TDTSRNAGNAVLFETVLTIMDIRSAAGLRVLAVNILGRFLLNSDRNIRYVALTSLLRLVQ 280 290 300 310 320 330 360 370 380 390 400 410 pF1KSD SEFSHEAVKTHIETVINALKTERDVSVRQRAVDLLYAMCDRSNAPQIVAEMLSYLETADY :. : ::. : ::.. :. : :.:. .::..: :. . ::. .. :. ..::. CCDS96 SD--HSAVQRHRPTVVECLR-ETDASLSRRALELSLALVNSSNVRAMMQELQAFLESCPP 340 350 360 370 380 390 420 430 440 450 460 470 pF1KSD SIREEIVLKVAILAEKYAVDYTWYVDTILNLIRIAGDYVSEEVWYRVIQIVINRDDVQGY ..: . . . . ::..: :..::::... :: .: ... . :.. . .....: CCDS96 DLRADCASGILLAAERFAPTKRWHIDTILHVLTTAGTHVRDDAVANLTQLIGGAQELHAY 400 410 420 430 440 450 480 490 500 510 520 pF1KSD AAKTVFEALQAPACHENLVKVGGYILGEFGNLI-AGDPRSSPLIQ------FHLLHS--K ... ...:: .. ::.:... .::.:.:. ::. . .: . ::.. . CCDS96 SVRRLYNALAEDISQQPLVQVAAWCIGEYGDLLLAGNCEEIEPLQVDEEEVLALLEKVLQ 460 470 480 490 500 510 530 540 550 560 570 580 pF1KSD FHLCSVP-TRALLLSTYIKFVNLFPEVKPTIQDVLRSDSQLRNADVELQQRAVEYLRLST :. :.: ::. :.. .:. . . . :..:. .. ::::::::::: : CCDS96 SHM-SLPATRGYALTALMKLSTRLCGDNNRIRQVVSIYGS--CLDVELQQRAVEYDTLFR 520 530 540 550 560 570 590 600 610 620 630 640 pF1KSD VASTDILATVLEEMPPFPERESSILAKLKKKKGPSTVTDLEDTKRDRSVDVNGGPEPAPA . :..::.:: : .. ::.. : :..:... . . :.:. CCDS96 -KYDHMRAAILEKMP------------LVERDGPQA--D-EEAKESKEAAQLSEAAPVPT 580 590 600 610 650 660 670 680 690 700 pF1KSD STSAVSTPSPSADLLGL--GAAPPAPAGP--PPSSGGSGLLVDVFSDSASVVAPLAPGSE .: : ::: : ::. . : :: ::. :: .. : : : :: . CCDS96 EPQA----SQLLDLLDLLDGASGDVQHPPHLDPSPGGA--LVHLL-DLPCVPPPPAPIPD 620 630 640 650 660 710 720 730 740 750 760 pF1KSD DNFARFVCKNNGVLFENQLLQIGLKSEFRQNLGRMFIFYGNKTSTQFLNFTPT-LICSDD . .:: . .:..: : .: . ... . :.:.: . : .::. CCDS96 LK-----------VFEREGVQLNL-SFIRPPENPALLLI-TITATNFSEGDVTHFICQAA 670 680 690 700 710 770 780 790 800 810 pF1KSD LQPNLNLQTK-PVDPTV--EGGAQVQQVVNIECVSDFTEAPV-LNIQFRYGGTFQNVSVQ . .:.:: . : :: .:: . :. : . ..::. :.... : : ::: CCDS96 VPKSLQLQLQAPSGNTVPARGGLPITQLFRIL---NPNKAPLRLKLRLTYDHFHQ--SVQ 720 730 740 750 760 770 820 830 840 850 860 870 pF1KSD LPITLNKFFQPTEMASQDFFQRWKQLSNPQQEVQNIFKAKHPMDTEVTKAKIIGFGSALL . .:.. :.: CCDS96 EIFEVNNL--PVESWQ 780 939 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 04:01:41 2016 done: Thu Nov 3 04:01:42 2016 Total Scan time: 4.980 Total Display time: 0.270 Function used was FASTA [36.3.4 Apr, 2011]