FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9730, 465 aa 1>>>pF1KB9730 465 - 465 aa - 465 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.8750+/-0.000932; mu= 7.3073+/- 0.056 mean_var=189.0560+/-39.634, 0's: 0 Z-trim(112.1): 47 B-trim: 67 in 1/52 Lambda= 0.093278 statistics sampled from 12880 (12912) to 12880 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.741), E-opt: 0.2 (0.397), width: 16 Scan time: 2.920 The best scores are: opt bits E(32554) CCDS10150.1 ONECUT1 gene_id:3175|Hs108|chr15 ( 465) 3225 446.4 3e-125 CCDS42440.1 ONECUT2 gene_id:9480|Hs108|chr18 ( 504) 1849 261.3 1.7e-69 CCDS45900.1 ONECUT3 gene_id:390874|Hs108|chr19 ( 494) 1028 150.8 3.1e-36 >>CCDS10150.1 ONECUT1 gene_id:3175|Hs108|chr15 (465 aa) initn: 3225 init1: 3225 opt: 3225 Z-score: 2362.2 bits: 446.4 E(32554): 3e-125 Smith-Waterman score: 3225; 100.0% identity (100.0% similar) in 465 aa overlap (1-465:1-465) 10 20 30 40 50 60 pF1KB9 MNAQLTMEAIGELHGVSHEPVPAPADLLGGSPHARSSVAHRGSHLPPAHPRSMGMASLLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MNAQLTMEAIGELHGVSHEPVPAPADLLGGSPHARSSVAHRGSHLPPAHPRSMGMASLLD 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 GGSGGGDYHHHHRAPEHSLAGPLHPTMTMACETPPGMSMPTTYTTLTPLQPLPPISTVSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GGSGGGDYHHHHRAPEHSLAGPLHPTMTMACETPPGMSMPTTYTTLTPLQPLPPISTVSD 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 KFPHHHHHHHHHHHPHHHQRLAGNVSGSFTLMRDERGLASMNNLYTPYHKDVAGMGQSLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 KFPHHHHHHHHHHHPHHHQRLAGNVSGSFTLMRDERGLASMNNLYTPYHKDVAGMGQSLS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 PLSSSGLGSIHNSQQGLPHYAHPGAAMPTDKMLTPNGFEAHHPAMLGRHGEQHLTPTSAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 PLSSSGLGSIHNSQQGLPHYAHPGAAMPTDKMLTPNGFEAHHPAMLGRHGEQHLTPTSAG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 MVPINGLPPHHPHAHLNAQGHGQLLGTAREPNPSVTGAQVSNGSNSGQMEEINTKEVAQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MVPINGLPPHHPHAHLNAQGHGQLLGTAREPNPSVTGAQVSNGSNSGQMEEINTKEVAQR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 ITTELKRYSIPQAIFAQRVLCRSQGTLSDLLRNPKPWSKLKSGRETFRRMWKWLQEPEFQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 ITTELKRYSIPQAIFAQRVLCRSQGTLSDLLRNPKPWSKLKSGRETFRRMWKWLQEPEFQ 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 RMSALRLAACKRKEQEHGKDRGNTPKKPRLVFTDVQRRTLHAIFKENKRPSKELQITISQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 RMSALRLAACKRKEQEHGKDRGNTPKKPRLVFTDVQRRTLHAIFKENKRPSKELQITISQ 370 380 390 400 410 420 430 440 450 460 pF1KB9 QLGLELSTVSNFFMNARRRSLDKWQDEGSSNSGNSSSSSSTCTKA ::::::::::::::::::::::::::::::::::::::::::::: CCDS10 QLGLELSTVSNFFMNARRRSLDKWQDEGSSNSGNSSSSSSTCTKA 430 440 450 460 >>CCDS42440.1 ONECUT2 gene_id:9480|Hs108|chr18 (504 aa) initn: 1348 init1: 1017 opt: 1849 Z-score: 1361.0 bits: 261.3 E(32554): 1.7e-69 Smith-Waterman score: 1890; 63.4% identity (76.2% similar) in 513 aa overlap (1-465:20-504) 10 20 30 pF1KB9 MNAQLTMEAIGELHGVSHEPVPAPADLLGG----------- :: .::::..: ::: . . . :: CCDS42 MKAAYTAYRCLTKDLEGCAMNPELTMESLGTLHGPAGGGSGGGGGGGGGGGGGGPGHEQE 10 20 30 40 50 60 40 50 60 pF1KB9 -----SPH--ARSSVAH-RGSHLPPAHPRSMG-----------------MASLLDGGSGG ::: .:.... :: ::. . .: :::.:: : CCDS42 LLASPSPHHAGRGAAGSLRGPPPPPTAHQELGTAAAAAAAASRSAMVTSMASILD----G 70 80 90 100 110 70 80 90 100 110 120 pF1KB9 GDYHHHHRAPEHSLAGPLHPTMTMACET-PPGMSMPTTYTTLTPLQPLPPISTVSDKFPH :::. :: :. ::: .:.:.:.. ::::.: .::::::::::::::::::::: : CCDS42 GDYR-----PELSI--PLHHAMSMSCDSSPPGMGMSNTYTTLTPLQPLPPISTVSDKFHH 120 130 140 150 160 130 140 150 160 170 180 pF1KB9 HHHHHH-HHHHPHHHQRLAGNVSGSFTLMRDERGLASMNNLYTPYHKDVAGMGQSLSPLS : ::: :::: ::::::.:::::::::::::::: .:::::.:: :.. ::.::::::. CCDS42 PHPHHHPHHHHHHHHQRLSGNVSGSFTLMRDERGLPAMNNLYSPY-KEMPGMSQSLSPLA 170 180 190 200 210 220 190 200 210 220 230 pF1KB9 SS----GLGSIHNSQQGLPHYAHPGAAMPTDKMLTPNGFEAHHPAMLGRHGEQHL----- .. :::..::.::.::.:. :: ::::.:: :.::: ::: : ::::: CCDS42 ATPLGNGLGGLHNAQQSLPNYGPPGH----DKMLSPN-FDAHHTAMLTR-GEQHLSRGLG 230 240 250 260 270 280 240 250 260 270 280 290 pF1KB9 TPTSAGMVPINGLPPHHPHAHLNAQGHGQLLGTARE-PNPSVTGAQVSNGSNSGQMEEIN :: .: : .::: ::: .: .:.:: .:. .:: : : .:.::.. :::.:::: CCDS42 TPPAAMMSHLNGL--HHP-GH--TQSHGPVLAPSRERPPSSSSGSQVAT---SGQLEEIN 290 300 310 320 330 300 310 320 330 340 350 pF1KB9 TKEVAQRITTELKRYSIPQAIFAQRVLCRSQGTLSDLLRNPKPWSKLKSGRETFRRMWKW :::::::::.:::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 TKEVAQRITAELKRYSIPQAIFAQRVLCRSQGTLSDLLRNPKPWSKLKSGRETFRRMWKW 340 350 360 370 380 390 360 370 380 390 400 410 pF1KB9 LQEPEFQRMSALRLAACKRKEQEHGKDRGNTPKKPRLVFTDVQRRTLHAIFKENKRPSKE ::::::::::::::::::::::: .:::.:. :: ::::::.::::: :::::::::::: CCDS42 LQEPEFQRMSALRLAACKRKEQEPNKDRNNSQKKSRLVFTDLQRRTLFAIFKENKRPSKE 400 410 420 430 440 450 420 430 440 450 460 pF1KB9 LQITISQQLGLELSTVSNFFMNARRRSLDKWQDEGSSNSGNSSSSSSTCTKA .::::::::::::.::::::::::::::.::::. :. :.:::.::::::: CCDS42 MQITISQQLGLELTTVSNFFMNARRRSLEKWQDDLST--GGSSSTSSTCTKA 460 470 480 490 500 >>CCDS45900.1 ONECUT3 gene_id:390874|Hs108|chr19 (494 aa) initn: 1320 init1: 963 opt: 1028 Z-score: 764.0 bits: 150.8 E(32554): 3.1e-36 Smith-Waterman score: 1500; 54.3% identity (70.6% similar) in 506 aa overlap (4-465:2-494) 10 20 30 40 50 pF1KB9 MNAQLTMEAIGELHGVSHEPVPAPADLLGGSPHARSSVA-HRGSHLPPAHPRSM-GMASL .:..:..: ::.:.: : : : . ::::..: ::: . :..: . ::::: CCDS45 MELSLESLGGLHSVAH----AQAGELLSPGHARSAAAQHRGL-VAPGRPGLVAGMASL 10 20 30 40 50 60 70 80 90 100 pF1KB9 LDGGSGGGDYHHHHRAPEHS----------LAGPLHPTMTMACETPPGMSMPTTYTTLTP ::::.::: . : :::::::.: ::::.: :.. ::::::: CCDS45 LDGGGGGGGGGAGGAGGAGSAGGGADFRGELAGPLHPAMGMACEAP-GLG--GTYTTLTP 60 70 80 90 100 110 110 120 130 140 150 pF1KB9 LQPLPPISTVSDKFPHHH---------HHHHHHHHPHHH---------QRLAGNVSGSFT :: :::...:.::: :.: : : : ::: ::::..:::::: CCDS45 LQHLPPLAAVADKF-HQHAAAAAVAGAHGGHPHAHPHPAAAPPPPPPPQRLAASVSGSFT 120 130 140 150 160 160 170 180 190 200 pF1KB9 LMRDERG-LASMNNLYTPYHKDVAGMGQSLSPLSSSGLGSIHNSQQGLPH--------YA ::::::. :::...:: :: :.. .::. :::: .. ..:.. : : :. CCDS45 LMRDERAALASVGHLYGPYGKELPAMGSPLSPLPNALPPALHGAPQPPPPPPPPPLAAYG 170 180 190 200 210 220 210 220 230 240 250 pF1KB9 HPGAAMPTDKMLTPNGFEAHHPAMLGRHGEQHLT---PTSAGMVPINGLPPHHPHAHLNA :: . ::.: : .:: : :.::: .:. :. : ..: . .: . : CCDS45 PPGH-LAGDKLLPPAAFEPH-AALLGR-AEDALARGLPGGGGGTGSGGAGSGSAAGLLAP 230 240 250 260 270 280 260 270 280 290 300 310 pF1KB9 QGHGQLLGTAREPNPSVTGAQVSNG--SNSGQMEEINTKEVAQRITTELKRYSIPQAIFA : : . :. :. . : :.: : .. :::::::::::::.::::::::::::: CCDS45 LG-GLAAAGAHGPHGGGGGPGGSGGGPSAGAAAEEINTKEVAQRITAELKRYSIPQAIFA 290 300 310 320 330 340 320 330 340 350 360 370 pF1KB9 QRVLCRSQGTLSDLLRNPKPWSKLKSGRETFRRMWKWLQEPEFQRMSALRLAACKRKEQE ::.::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 QRILCRSQGTLSDLLRNPKPWSKLKSGRETFRRMWKWLQEPEFQRMSALRLAACKRKEQE 350 360 370 380 390 400 380 390 400 410 420 430 pF1KB9 HGKDRGNTPKKPRLVFTDVQRRTLHAIFKENKRPSKELQITISQQLGLELSTVSNFFMNA . :.:. ::: ::::::.::::: ::::::::::::.:.::::::::::.::::::::: CCDS45 QQKERALQPKKQRLVFTDLQRRTLIAIFKENKRPSKEMQVTISQQLGLELNTVSNFFMNA 410 420 430 440 450 460 440 450 460 pF1KB9 RRRSLDKWQDEGSSNSGNSSSSSSTCTKA ::: ...: .: :. :. .....: .:: CCDS45 RRRCMNRWAEEPSTAPGGPAGATATFSKA 470 480 490 465 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 18:33:55 2016 done: Fri Nov 4 18:33:56 2016 Total Scan time: 2.920 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]