FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1150, 593 aa 1>>>pF1KA1150 593 - 593 aa - 593 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.7261+/-0.000862; mu= 4.6039+/- 0.052 mean_var=175.6745+/-36.008, 0's: 0 Z-trim(113.6): 14 B-trim: 387 in 1/52 Lambda= 0.096765 statistics sampled from 14197 (14205) to 14197 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.758), E-opt: 0.2 (0.436), width: 16 Scan time: 3.880 The best scores are: opt bits E(32554) CCDS1054.1 GATAD2B gene_id:57459|Hs108|chr1 ( 593) 3881 553.8 2.2e-157 CCDS12402.2 GATAD2A gene_id:54815|Hs108|chr19 ( 633) 826 127.4 5.6e-29 CCDS77270.1 GATAD2A gene_id:54815|Hs108|chr19 ( 634) 810 125.1 2.6e-28 >>CCDS1054.1 GATAD2B gene_id:57459|Hs108|chr1 (593 aa) initn: 3881 init1: 3881 opt: 3881 Z-score: 2939.1 bits: 553.8 E(32554): 2.2e-157 Smith-Waterman score: 3881; 100.0% identity (100.0% similar) in 593 aa overlap (1-593:1-593) 10 20 30 40 50 60 pF1KA1 MDRMTEDALRLNLLKRSLDPADERDDVLAKRLKMEGHEAMERLKMLALLKRKDLANLEVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MDRMTEDALRLNLLKRSLDPADERDDVLAKRLKMEGHEAMERLKMLALLKRKDLANLEVP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 HELPTKQDGSGVKGYEEKLNGNLRPHGDNRTAGRPGKENINDEPVDMSARRSEPERGRLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 HELPTKQDGSGVKGYEEKLNGNLRPHGDNRTAGRPGKENINDEPVDMSARRSEPERGRLT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 PSPDIIVLSDNEASSPRSSSRMEERLKAANLEMFKGKGIEERQQLIKQLRDELRLEEARL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 PSPDIIVLSDNEASSPRSSSRMEERLKAANLEMFKGKGIEERQQLIKQLRDELRLEEARL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA1 VLLKKLRQSQLQKENVVQKTPVVQNAASIVQPSPAHVGQQGLSKLPSRPGAQGVEPQNLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 VLLKKLRQSQLQKENVVQKTPVVQNAASIVQPSPAHVGQQGLSKLPSRPGAQGVEPQNLR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA1 TLQGHSVIRSATNTTLPHMLMSQRVIAPNPAQLQGQRGPPKPGLVRTTTPNMNPAINYQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 TLQGHSVIRSATNTTLPHMLMSQRVIAPNPAQLQGQRGPPKPGLVRTTTPNMNPAINYQP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA1 QSSSSVPCQRTTSSAIYMNLASHIQPGTVNRVSSPLPSPSAMTDAANSQAAAKLALRKQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 QSSSSVPCQRTTSSAIYMNLASHIQPGTVNRVSSPLPSPSAMTDAANSQAAAKLALRKQL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA1 EKTLLEIPPPKPPAPLLHFLPSAANSEFIYMVGLEEVVQSVIDSQGKSCASLLRVEPFVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 EKTLLEIPPPKPPAPLLHFLPSAANSEFIYMVGLEEVVQSVIDSQGKSCASLLRVEPFVC 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA1 AQCRTDFTPHWKQEKNGKILCEQCMTSNQKKALKAEHTNRLKNAFVKALQQEQEIEQRLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 AQCRTDFTPHWKQEKNGKILCEQCMTSNQKKALKAEHTNRLKNAFVKALQQEQEIEQRLQ 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA1 QQAALSPTTAPAVSSVSKQETIMRHHTLRQAPQPQSSLQRGIPTSARSMLSNFAQAPQLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 QQAALSPTTAPAVSSVSKQETIMRHHTLRQAPQPQSSLQRGIPTSARSMLSNFAQAPQLS 490 500 510 520 530 540 550 560 570 580 590 pF1KA1 VPGGLLGMPGVNIAYLNTGIGGHKGPSLADRQREYLLDMIPPRSISQSISGQK ::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 VPGGLLGMPGVNIAYLNTGIGGHKGPSLADRQREYLLDMIPPRSISQSISGQK 550 560 570 580 590 >>CCDS12402.2 GATAD2A gene_id:54815|Hs108|chr19 (633 aa) initn: 834 init1: 393 opt: 826 Z-score: 633.7 bits: 127.4 E(32554): 5.6e-29 Smith-Waterman score: 1237; 41.1% identity (61.8% similar) in 655 aa overlap (4-581:1-622) 10 20 30 40 50 60 pF1KA1 MDRMTEDALRLNLLKRSLDPADERDDVLAKRLKMEGHEAMERLKMLALLKRKDLANLEVP :::.: : ::.:. .::: .:..::: .:: .:: : . CCDS12 MTEEACRTRSQKRALERDPTEDDVESKKIKMERG-------LLA----SDL-NTDGD 10 20 30 40 70 80 90 100 110 120 pF1KA1 HELPTKQDGSGVKGYEEKLNGNLRPHGDNRTAGRPGKENINDEPVDMSARRSEPERGRLT .. : . :.: .: :: . : :. ..: :::: . .:. . : CCDS12 MRV-TPEPGAG------PTQGLLRATEATAMAMGRGEGLVGDGPVDMRTSHSDMKSERRP 50 60 70 80 90 130 140 150 160 170 pF1KA1 PSPDIIVLSDNEA-SSPRSSSRMEERLKAANLEMFKGKGIEERQQLIKQLRDELRLEEAR ::::.::::::: :::: .. :: .. : . .. :::...::::..:::::::. CCDS12 PSPDVIVLSDNEQPSSPRVNGLTTVALKETSTEALMKSSPEERERMIKQLKEELRLEEAK 100 110 120 130 140 150 180 190 200 pF1KA1 LVLLKKLRQSQLQKENVVQKT------------PVV---QNA---------------ASI :::::::::::.::: ..:: :.: :: .:. CCDS12 LVLLKKLRQSQIQKEATAQKPTGSVGSTVTTPPPLVRGTQNIPAGKPSLQTSSARMPGSV 160 170 180 190 200 210 210 220 230 240 250 260 pF1KA1 VQPSPAHVGQQGLSKLPSRPGAQGVEPQNLRTLQGHSVIRSATNTTLPHMLMSQRVIAPN . : .. :::. ::: . ..: : : .: : ::. ..: : .:.. :. .:. CCDS12 IPPPLVRGGQQASSKLGPQASSQVVMPPLVRGAQQIHSIRQHSSTGPPPLLLAPRASVPS 220 230 240 250 260 270 270 280 290 300 310 320 pF1KA1 PAQLQGQRGPPKPGLVRTTT-PNMNPAINYQPQSSSSVPCQRTTSSAIYMNLASHIQPGT .:.:::: . ::.:... :: . .: :: . . :..:: .. : . CCDS12 -VQIQGQR-IIQQGLIRVANVPNTSLLVNI-PQPTPASLKGTTATSA-----QANSTPTS 280 290 300 310 320 330 330 340 350 360 370 380 pF1KA1 VNRVSSPLPSPSAMTDAANSQAAAKLALRKQLEKTLLEIPPPKPPAPLLHFLPSAANSEF : : . :: :. ::::::::::::::::::::::::::: ..:::::::.:: CCDS12 VASVVTSAESP------ASRQAAAKLALRKQLEKTLLEIPPPKPPAPEMNFLPSAANNEF 340 350 360 370 380 390 400 410 420 430 440 pF1KA1 IYMVGLEEVVQSVIDSQGK-SCASLLRVEPFVCAQCRTDFTPHWKQEKNGKILCEQCMTS ::.::::::::.....::. : :..: ::..::::.:::: .:..::.: :.::.:::. CCDS12 IYLVGLEEVVQNLLETQGRMSAATVLSREPYMCAQCKTDFTCRWREEKSGAIMCENCMTT 390 400 410 420 430 440 450 460 470 480 490 pF1KA1 NQKKALKAEHTNRLKNAFVKALQQEQEIEQRLQQQ------AALSPTTAP--AVSSVSK- :::::::.:::.::: :::::::::::::::: :: : ::.:: ....: : CCDS12 NQKKALKVEHTSRLKAAFVKALQQEQEIEQRLLQQGTAPAQAKAEPTAAPHPVLKQVIKP 450 460 470 480 490 500 500 510 520 530 540 pF1KA1 -QETIMRHHTLRQAP-----QPQSSLQRGIPTSARSMLSNFAQAPQLSVPGGLLGM---- .. .: :. : .:.:.:: :. :..: .:. .:.:. .. .. CCDS12 RRKLAFRSGEARDWSNGAVLQASSQLSRGSATTPRGVLHTFSPSPKLQNSASATALVSRT 510 520 530 540 550 560 550 560 570 580 pF1KA1 ----------------------P---GVNIAYLNTGIGGHKGPSLADRQREYLLDMIPPR : : ..:... ... ::. : .:::::::::::: CCDS12 GRHSERTVSAGKGSATSNWKKTPLSTGGTLAFVSPSLAVHKSSSAVDRQREYLLDMIPPR 570 580 590 600 610 620 590 pF1KA1 SISQSISGQK CCDS12 SIPQSATWK 630 >>CCDS77270.1 GATAD2A gene_id:54815|Hs108|chr19 (634 aa) initn: 1129 init1: 381 opt: 810 Z-score: 621.6 bits: 125.1 E(32554): 2.6e-28 Smith-Waterman score: 1225; 41.0% identity (61.7% similar) in 656 aa overlap (4-581:1-623) 10 20 30 40 50 60 pF1KA1 MDRMTEDALRLNLLKRSLDPADERDDVLAKRLKMEGHEAMERLKMLALLKRKDLANLEVP :::.: : ::.:. .::: .:..::: .:: .:: : . CCDS77 MTEEACRTRSQKRALERDPTEDDVESKKIKMERG-------LLA----SDL-NTDGD 10 20 30 40 70 80 90 100 110 120 pF1KA1 HELPTKQDGSGVKGYEEKLNGNLRPHGDNRTAGRPGKENINDEPVDMSARRSEPERGRLT .. : . :.: .: :: . : :. ..: :::: . .:. . : CCDS77 MRV-TPEPGAG------PTQGLLRATEATAMAMGRGEGLVGDGPVDMRTSHSDMKSERRP 50 60 70 80 90 130 140 150 160 170 pF1KA1 PSPDIIVLSDNEA-SSPRSSSRMEERLKAANLEMFKGKGIEERQQLIKQLRDELRLEEAR ::::.::::::: :::: .. :: .. : . .. :::...::::..:::::::. CCDS77 PSPDVIVLSDNEQPSSPRVNGLTTVALKETSTEALMKSSPEERERMIKQLKEELRLEEAK 100 110 120 130 140 150 180 190 200 pF1KA1 LVLLKKLRQSQLQKENVVQKT------------PVV---QNA---------------ASI :::::::::::.::: ..:: :.: :: .:. CCDS77 LVLLKKLRQSQIQKEATAQKPTGSVGSTVTTPPPLVRGTQNIPAGKPSLQTSSARMPGSV 160 170 180 190 200 210 210 220 230 240 250 260 pF1KA1 VQPSPAHVGQQGLSKLPSRPGAQGVEPQNLRTLQGHSVIRSATNTTLPHMLMSQRVIAPN . : .. :::. ::: . ..: : : .: : ::. ..: : .:.. :. .:. CCDS77 IPPPLVRGGQQASSKLGPQASSQVVMPPLVRGAQQIHSIRQHSSTGPPPLLLAPRASVPS 220 230 240 250 260 270 270 280 290 300 310 320 pF1KA1 PAQLQGQRGPPKPGLVRTTT-PNMNPAINYQPQSSSSVPCQRTTSSAIYMNLASHIQPGT .:.:::: . ::.:... :: . .: :: . . :..:: .. : . CCDS77 -VQIQGQR-IIQQGLIRVANVPNTSLLVNI-PQPTPASLKGTTATSA-----QANSTPTS 280 290 300 310 320 330 330 340 350 360 370 380 pF1KA1 VNRVSSPLPSPSAMTDAANSQAAAKLALRKQLEKTLLEIPPPKPPAPLLHFLPSAANSEF : : . :: :. ::::::::::::::::::::::::::: ..:::::::.:: CCDS77 VASVVTSAESP------ASRQAAAKLALRKQLEKTLLEIPPPKPPAPEMNFLPSAANNEF 340 350 360 370 380 390 400 410 420 430 440 pF1KA1 IYMVGLEEVVQSVIDSQ-GK-SCASLLRVEPFVCAQCRTDFTPHWKQEKNGKILCEQCMT ::.::::::::.....: :. : :..: ::..::::.:::: .:..::.: :.::.::: CCDS77 IYLVGLEEVVQNLLETQAGRMSAATVLSREPYMCAQCKTDFTCRWREEKSGAIMCENCMT 390 400 410 420 430 440 450 460 470 480 490 pF1KA1 SNQKKALKAEHTNRLKNAFVKALQQEQEIEQRLQQQ------AALSPTTAP--AVSSVSK .:::::::.:::.::: :::::::::::::::: :: : ::.:: ....: : CCDS77 TNQKKALKVEHTSRLKAAFVKALQQEQEIEQRLLQQGTAPAQAKAEPTAAPHPVLKQVIK 450 460 470 480 490 500 500 510 520 530 540 pF1KA1 --QETIMRHHTLRQAP-----QPQSSLQRGIPTSARSMLSNFAQAPQLSVPGGLLGM--- .. .: :. : .:.:.:: :. :..: .:. .:.:. .. .. CCDS77 PRRKLAFRSGEARDWSNGAVLQASSQLSRGSATTPRGVLHTFSPSPKLQNSASATALVSR 510 520 530 540 550 560 550 560 570 580 pF1KA1 -----------------------P---GVNIAYLNTGIGGHKGPSLADRQREYLLDMIPP : : ..:... ... ::. : .:::::::::::: CCDS77 TGRHSERTVSAGKGSATSNWKKTPLSTGGTLAFVSPSLAVHKSSSAVDRQREYLLDMIPP 570 580 590 600 610 620 590 pF1KA1 RSISQSISGQK CCDS77 RSIPQSATWK 630 593 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 02:07:06 2016 done: Sat Nov 5 02:07:07 2016 Total Scan time: 3.880 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]