FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1685, 1435 aa 1>>>pF1KA1685 1435 - 1435 aa - 1435 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 12.8325+/-0.00115; mu= -10.1586+/- 0.069 mean_var=410.9125+/-83.912, 0's: 0 Z-trim(114.2): 15 B-trim: 0 in 0/52 Lambda= 0.063270 statistics sampled from 14755 (14767) to 14755 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.745), E-opt: 0.2 (0.454), width: 16 Scan time: 6.840 The best scores are: opt bits E(32554) CCDS45847.1 ASXL3 gene_id:80816|Hs108|chr18 (2248) 767 85.5 1.9e-15 CCDS13201.1 ASXL1 gene_id:171023|Hs108|chr20 (1541) 693 78.6 1.5e-13 >>CCDS45847.1 ASXL3 gene_id:80816|Hs108|chr18 (2248 aa) initn: 1759 init1: 685 opt: 767 Z-score: 390.7 bits: 85.5 E(32554): 1.9e-15 Smith-Waterman score: 1250; 28.4% identity (53.7% similar) in 1429 aa overlap (1-1392:1-1225) 10 20 30 40 50 60 pF1KA1 MREKGRRKKGRTWAEAAKTVLEKYPNTPMSHKEILQVIQREGLKEIRSGTSPLACLNAML :..: :.:: :::::::. .:::.::.::. :.::.:::.::::: ::::::::::::: CCDS45 MKDK-RKKKDRTWAEAARLALEKHPNSPMTAKQILEVIQKEGLKET-SGTSPLACLNAML 10 20 30 40 50 70 80 90 100 110 120 pF1KA1 HTNSRGEEGIFYKVPGRMGVYTLKKDVPDGVKELSEGSEESSDGQSDSQSSENSSSSSDG :::.: .: :.:.::. :.:.:::. : : .. . : .:. . .. . ... CCDS45 HTNTRIGDGTFFKIPGKSGLYALKKE------ESSCPADGTLDLVCESELDGTDMAEANA 60 70 80 90 100 110 130 140 150 160 170 180 pF1KA1 GSNKEGKKSRWKRKVSSSSPQSGCPSPTIPAGKVISPSQKHSKKALKQALKQQQQKKQQQ ....: :. .::. .:. . .. . :..: :.:.::::::::.:::.. CCDS45 HGEENGVCSKQVTDEASSTRDSSLTNTAVQS-KLVSSFQQHTKKALKQALRQQQKR---- 120 130 140 150 160 190 200 210 220 230 240 pF1KA1 QCRPSISISSNQHLSLKTVKAASDSVPAKPATWEGKQSDGQTGSPQNSNSSFSSSVKVEN : ..:. : ::: : : .:::. .:: .... . ::. .... CCDS45 --RNGVSMMVN-----KTVP----RVVLTPLKVSDEQSDSPSGSESKNGEADSSDKEMKH 170 180 190 200 210 250 260 270 280 290 pF1KA1 TLLG-LGKKSFQRSERLHTR---QMKRTKCADIDVETPDSILVNTNLRALINKHTFSVLP . ::.. :. .::. ..: :: :::.::: :::::::::::::::::. :: CCDS45 GQKSPTGKQTSQHLKRLKKSGLGHLKWTKAEDIDIETPGSILVNTNLRALINKHTFASLP 220 230 240 250 260 270 300 310 320 330 340 350 pF1KA1 GDCQQRLLLLLPEVDRQVGPDGLMKLNGSALNNEFFTSAAQGWKERLSEGEFTPEMQVRI :: :::::::::::.: ::...:. ::::::::. ::::::.::.:::::::::.:: CCDS45 QHFQQYLLLLLPEVDRQMGSDGILRLSTSALNNEFFAYAAQGWKQRLAEGEFTPEMQLRI 280 290 300 310 320 330 360 370 380 390 400 410 pF1KA1 RQEIEKEKKVEPWKEQFFESYYGQSSGLSLEDSKKLTASPSDPKVKKTPAEQPKSMPVSE :::::::::.:::::.::: .::.. :.: :.: :::..:.. .... . ...::: CCDS45 RQEIEKEKKTEPWKEKFFERFYGEKLGMSREESVKLTTGPNNAGAQSSSSCGTSGLPVSA 340 350 360 370 380 390 420 430 440 450 460 470 pF1KA1 ASLIRIVPVVSQSECKEEALQMSSPGRKEECESQGEVQPNFSTSSEPLL----SSALNTH . . ... .:.::. : :.: .. :.. .. . CCDS45 QTAL----------AEQQPKSMKSPASPE---------PGFCATLCPMVEIPPKDIMAEL 400 410 420 430 480 490 500 510 520 530 pF1KA1 ELSSIL-PIKCPKDEDLLEQKPVTSAEQESEKNHLTTASNYNKSESQESLVTSPSKPKSP : .:: : . .:.. :. .. : ..: :: : .. :: :::..: CCDS45 ESEDILIPEESVIQEEIAEEVETSICECQDE-NH-KTIPEF--SEEAESLTNSH------ 440 450 460 470 480 540 550 560 570 580 590 pF1KA1 GVEKPIVKPTAGAGPQETNMKEPLATLVDQSPESLKRKSSLTQEEAPVSWEKRPRVTENR :.: . : . . :.. : :: . ... :: ::: : .. CCDS45 --EEPQIAPPEDNLESCVMMNDVLETL-PHIEVKIEGKSESPQEEMTVVIDQ-------- 490 500 510 520 530 600 610 620 630 640 650 pF1KA1 QHQQPFQVSPQPFLNRGDRIQVRKVPPLKIPVSRISPMPFHPSQVSPRARFPVSITSPN- :. : . .: . ....: . :... : ..:. CCDS45 -------------LEVCDSL----IPSTS-SMTHVSDTEHKESETA------VETSTPKI 540 550 560 570 660 670 680 690 700 710 pF1KA1 RTGARTLADIKAKAQLVKAQRAAAAAAAAAAAAASVGGTIPGPGPGGGQGPGEGGEGQTA .::. .: :: :.:: . CCDS45 KTGSSSLE---------------------------------------GQFPNEGIAIDME 580 590 720 730 740 750 760 770 pF1KA1 RGGSPGSDRVSETGKGPTLELAGTGSRGGTRELLPCGPETQPQSETKTTPSQAQPHSVSG ..: ...::.. ... . .:. : : ::: :: . :: CCDS45 LQSDP-EEQLSENACISETSFSSESPEGACTSLPSPGGETQSTSEESCTP---------- 600 610 620 630 640 780 790 800 810 820 830 pF1KA1 AQLQQTPPVPPTPAVSGACTSVPSPAHIEKLDNEKLNPTRATATVASVSHPQGPSSCRQE :.:. : :. : : . .: .... . :.. : : CCDS45 ASLETT-----------FCSEVSSTENTDKYNQRNSTDENFHASLMS------------E 650 660 670 840 850 860 870 880 890 pF1KA1 KAPSPTGPALISGASPVHCAADGTVELKAGPSKNIPNPSASSKTDASVPVAVTPSPLTSL .: :.: :: :: .. . .:.: .:.: : .: ...:.. : ..:. CCDS45 ISPISTSPE-ISEAS---LMSNLPLTSEASPVSNLPLTSETSPM-SDLPLTSETSSVSSM 680 690 700 710 720 730 900 910 920 930 940 pF1KA1 LTTAT---LEKLPVPQVSATTAPAGSAPPSSTLPAASSLKTPGTSLNMNGPTLRPTSSIP : :. . .::.: . :.: ... . . : .. :.:..: . .: . :: CCDS45 LLTSETTFVSSLPLP---SETSPISNSSINERM-AHQQRKSPSVSEEPLSPQ-KDESSAT 740 750 760 770 780 950 960 970 980 990 1000 pF1KA1 ANNPLVTQLL-QGKDVPMEQILPKPLTKVEMKTVPLTAKEERGMGALIATNTTENSTREE :. :: .: : :.. :.:. . .: . : : . .... . . CCDS45 AK-PLGENLTSQQKNLSN---TPEPIIMSSSSIAPEAFPSED----LHNKTLSQQTCKSH 790 800 810 820 830 840 1010 1020 1030 1040 1050 1060 pF1KA1 VNERQSHPATQQQLGKT--LQSKQLPQVPRPLQLFSAKELRDSSIDTHQYHEGLSKATQD :. .. .::. .:..: .. :. . : . :.. : .. . :: :.. CCDS45 VDTEKPYPASIPELASTEMIKVKNHSVLQR-----TEKKVLPSPLELSVFSEG----TDN 850 860 870 880 890 1070 1080 1090 1100 1110 1120 pF1KA1 QILQTLIQRVRRQNLLSVVPPSQFNFAHSGFQLEDISTSQRFMLGFAGRRTSKPAMAGHY . . ... .. .: : . :. . . .. ::..:. . ... .:.:. . CCDS45 KGNELPSAKLQDKQYISSVDKAPFSEGSRNKTHKQGSTQSRLETSHTSK-SSEPSKSPDG 900 910 920 930 940 950 1130 1140 1150 1160 1170 1180 pF1KA1 LLNISTYGRGSESFRRTHSVNPEDRFCLSSPTEALKMGYTDCKNATGESSSSKEDDTDEE . : : : :: .: .. . : . . .: . .: .. : ::. :: CCDS45 IRNES---RDSEISKR--KTAEQHSFGICKEKRARIEDDQSTRNISSSSPPEKEQPPREE 960 970 980 990 1000 1190 1200 1210 1220 1230 pF1KA1 STGDE---QES-----VTVKEEPQVSQSAGKGDTS---SGPHSRETLSTSDCLA-SKNVK : : .: .: ::. ....:: :: .. . . .: : ..... CCDS45 PRVPPLKIQLSKIGPPFIIKSQP-VSKPESRASTSTSVSGGRNTGARTLADIKARAQQAR 1010 1020 1030 1040 1050 1060 1240 1250 1260 1270 1280 pF1KA1 AEIPLNEQTTLSKENYLFTR-----GQTFDEKTLARDLIQAAQKQMA-HAVRGKAIRSSP :. .... . . :. .:::. :. : .: : .:.. ...: CCDS45 AQREAAAAAAVAAAASIVSGAMGSPGEGGKTRTLAHIKEQTKAKLFAKHQARAHLFQTSK 1070 1080 1090 1100 1110 1120 1290 1300 1310 1320 1330 1340 pF1KA1 ELFSSTVLPLPADSPTHQP-LLLPPLQTPKLYGSPTQI--GPSYRGMINVSTSSDMDHNS : : :: : .: : : . :. :: : .:. :. : :. . ... CCDS45 E----TRLPPPLSSKEGPPNLEVSSTPETKMEGSTGVIIVNPNCRSPSN--KSAHLRETT 1130 1140 1150 1160 1170 1350 1360 1370 1380 1390 1400 pF1KA1 AVPGSQVSSNVGDVMSFSVTVTTIPASQAMNPSSHGQTIPVQAFSEENSIEGTPSKCYCR .: : : : . . ..: .. .:. : :: . :.. : ::: CCDS45 TV--LQQSLNPSK-LPETATDLSVHSSDENIPVSHLSEKIVSSTSSENSSVPMLFNKNSV 1180 1190 1200 1210 1220 1230 1410 1420 1430 pF1KA1 LKAMIMCKGCGAFCHDDCIGPSKLCVSCLVVR CCDS45 PVSVCSTAISGAIKEHPFVSSVDKSSVLMSVDSANTTISACNISMLKTIQGTDTPCIAII 1240 1250 1260 1270 1280 1290 >>CCDS13201.1 ASXL1 gene_id:171023|Hs108|chr20 (1541 aa) initn: 1581 init1: 629 opt: 693 Z-score: 356.6 bits: 78.6 E(32554): 1.5e-13 Smith-Waterman score: 1358; 33.1% identity (59.2% similar) in 1030 aa overlap (1-976:1-948) 10 20 30 40 50 60 pF1KA1 MREKGRRKKGRTWAEAAKTVLEKYPNTPMSHKEILQVIQREGLKEIRSGTSPLACLNAML :..: ..:: :::::::. :::.: ..::. :.:::::. :::::.:::::::::::::: CCDS13 MKDKQKKKKERTWAEAARLVLENYSDAPMTPKQILQVIEAEGLKEMRSGTSPLACLNAML 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 HTNSRGEEGIFYKVPGRMGVYTLKKDVPDGVKELSEGSEESSDGQSDSQSSENSSSSSDG :.:::: ::.:::.:::....:::::. . .. . : . .: .: .. .:. . CCDS13 HSNSRGGEGLFYKLPGRISLFTLKKDALQWSRHPATVEGEEPEDTADVESCGSNEASTVS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 GSNKEGKKSRWKRKVSSSSPQSGCPSPTIPAGKVISPSQKHSKKALKQALKQQQQKKQQQ : : . .. .: ...: . . .. .: . . : .: .:: : :::. CCDS13 GENDVS--------LDETSSNASCSTES--QSRPLS-NPRDSYRASSQANK---QKKKTG 130 140 150 160 190 200 210 220 230 pF1KA1 QCRPSISISSNQHLSLKTVKAASDSVPAKPATWEGKQSDGQTGSPQNSNSSF----SSSV : . .. ::. : .:. . . : ..::..:::..:.:. :... CCDS13 VMLPRVVLTP-----LKVNGAHVESASG----FSGCHADGESGSPSSSSSGSLALGSAAI 170 180 190 200 210 240 250 260 270 280 290 pF1KA1 KVENTLLGLGKKSFQRSERLHTRQMKRTKCADIDVETPDSILVNTNLRALINKHTFSVLP . . . .. .. : ::::.. .:: ::: :::::::::::::..:: .:: CCDS13 RGQAEVTQDPAPLLRGFRKPATGQMKRNRGEEIDFETPGSILVNTNLRALINSRTFHALP 220 230 240 250 260 270 300 310 320 330 340 350 pF1KA1 GDCQQRLLLLLPEVDRQVGPDGLMKLNGSALNNEFFTSAAQGWKERLSEGEFTPEMQVRI . ::.::.:::::::::: :::..:..::::::::: :::.:.:::..:::: :::::: CCDS13 SHFQQQLLFLLPEVDRQVGTDGLLRLSSSALNNEFFTHAAQSWRERLADGEFTHEMQVRI 280 290 300 310 320 330 360 370 380 390 400 410 pF1KA1 RQEIEKEKKVEPWKEQFFESYYGQSSGLSLEDSKKLTASPSDPKVKK---TPAEQPKSMP :::.::::::: :::.:::.::::. ::. :.: . ... . ..:. .:.:. . . CCDS13 RQEMEKEKKVEQWKEKFFEDYYGQKLGLTKEESLQQNVGQEEAEIKSGLCVPGESVR-IQ 340 350 360 370 380 390 420 430 440 450 460 470 pF1KA1 VSEASLIRIVPVVSQSECKEEALQMSSPGRKEECESQGEVQPNFSTSSE-PLLSSALNTH . :. : ..:. .. . .:.: :. : .. :..:. :: ... CCDS13 RGPATRQRDGHFKKRSRPDLRTRARRNLYKKQESEQAGVAKDAKSVASDVPLYKDGEAKT 400 410 420 430 440 450 480 490 500 510 520 530 pF1KA1 ELSSILPIKCPKDEDLLEQKPVTSAEQESEKNHLTTASNYNKSESQ-ESLVTSPSKP-KS . ... . : ..:: . : .. . : .. ... ..:. . ..: . CCDS13 DPAGLSSPHLPG---------TSSAAPDLEGPEFPVESVASRIQAEPDNLARASASPDRI 460 470 480 490 500 540 550 560 570 580 pF1KA1 PGVEKPIVKPTAGAGPQETNMKEPLATLVDQSPESLKRKSSLTQEEAPVSW-EKRPRVTE :.. :::: ::: :.. :::: .. : .:. ::.::. : CCDS13 PSL------------PQET---------VDQEPKDQKRKS--FEQAASASFPEKKPRL-E 510 520 530 540 590 600 610 620 630 pF1KA1 NRQH-----QQPFQVSPQPFLNRGDRIQVRKVPPLKIPVSRISPMPF----HPS-QVSPR .:: .. .::: .. ::::..: .:::.: :. .:. :. :: CCDS13 DRQSFRNTIESVHTEKPQPTKEEP------KVPPIRIQLSRIKP-PWVVKGQPTYQICPR 550 560 570 580 590 640 650 660 670 680 690 pF1KA1 ARFPVSITS-PNRTGARTLADIKAKAQLVKAQRAAAAAAAAAAAAASVGGTIPGPGPGGG .:.. .: . :::::::::::.: :.. :. ::..: . :: ::: ::: CCDS13 I-IPTTESSCRGWTGARTLADIKARALQVRGARGHHCHREAATTAIGGGG---GPGGGGG 600 610 620 630 640 650 700 710 720 730 740 750 pF1KA1 QGPGEGG-EGQTARGGSPGSDRVSETGKGPTLELAGTGSRGGTRELLPCGPETQPQSETK . ::: .:... :. . . : ::. :.. : .::: : . .... CCDS13 GATDEGGGRGSSSGDGGEACGHPEPRG-GPSTPGKCTSDLQRT-QLLPPYPLNGEHTQAG 660 670 680 690 700 710 760 770 780 790 800 810 pF1KA1 TTPSQAQPHSVSGAQ-----LQQTPPVPPTPAVSGACTSVP-SPAHIEKLDNEKLNPTRA :. :.:. ... . . : : : : .. : ...: .:. . . : ... CCDS13 TAMSRARREDLPSLRKEESCLLQRATVGLTDGL-GDASQLPVAPTGDQPCQALPLLSSQT 720 730 740 750 760 820 830 840 850 860 pF1KA1 TATVASVSHPQGPSSCRQEKAPSPT---------GPALISGASPVHC-AADGTVELKAGP ... : .:: . : : . : ::.. . .:. ..: :.: .: CCDS13 SVAERLVEQPQLHPDVRTECESGTTSWESDDEEQGPTVPADNGPIPSLVGDDTLEKGTGQ 770 780 790 800 810 820 870 880 890 900 910 pF1KA1 SKNIPNPSASSKTDASVPVAVTPSPLTSLLTTATLEKLPVPQVSATTAPAGSAPP----- . . .:. .. :: :::: : .. . : . . .:: :: CCDS13 ALD-SHPTMKD------PVNVTPS---STPESSPTDCLQNRAFDDELGLGGSCPPMRESD 830 840 850 860 870 920 930 940 950 960 pF1KA1 -------SSTLPAASSLK---TPGTSLNMNGPTLRPTSSIPANNPLVTQLLQGKDVPMEQ ...: . :::. :... .. : . ::. .: : . . : .: CCDS13 TRQENLKTKALVSNSSLHWIPIPSNDEVVKQPKPESREHIPSVEPQVGEEWE-KAAPTPP 880 890 900 910 920 930 970 980 990 1000 1010 1020 pF1KA1 ILPKPLTKVEMKTVPLTAKEERGMGALIATNTTENSTREEVNERQSHPATQQQLGKTLQS :: :: : CCDS13 ALPGDLTAEEGLDPLDSLTSLWTVPSRGGSDSNGSYCQQVDIEKLKINGDSEALSPHGES 940 950 960 970 980 990 1435 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 21:51:16 2016 done: Wed Nov 2 21:51:17 2016 Total Scan time: 6.840 Total Display time: 0.150 Function used was FASTA [36.3.4 Apr, 2011]