FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1470, 522 aa 1>>>pF1KSDA1470 522 - 522 aa - 522 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.8937+/-0.000915; mu= 11.8882+/- 0.055 mean_var=124.2099+/-25.115, 0's: 0 Z-trim(109.9): 36 B-trim: 0 in 0/50 Lambda= 0.115079 statistics sampled from 11196 (11230) to 11196 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.695), E-opt: 0.2 (0.345), width: 16 Scan time: 3.040 The best scores are: opt bits E(32554) CCDS181.1 RCC2 gene_id:55920|Hs108|chr1 ( 522) 3555 601.5 7.5e-172 CCDS323.1 RCC1 gene_id:1104|Hs108|chr1 ( 421) 394 76.6 6.1e-14 CCDS41295.1 RCC1 gene_id:1104|Hs108|chr1 ( 452) 394 76.7 6.4e-14 CCDS45277.1 HERC1 gene_id:8925|Hs108|chr15 (4861) 365 72.6 1.2e-11 CCDS82939.1 HERC3 gene_id:8916|Hs108|chr4 ( 368) 346 68.6 1.4e-11 CCDS34028.1 HERC3 gene_id:8916|Hs108|chr4 (1050) 346 68.9 3.1e-11 >>CCDS181.1 RCC2 gene_id:55920|Hs108|chr1 (522 aa) initn: 3555 init1: 3555 opt: 3555 Z-score: 3198.7 bits: 601.5 E(32554): 7.5e-172 Smith-Waterman score: 3555; 100.0% identity (100.0% similar) in 522 aa overlap (1-522:1-522) 10 20 30 40 50 60 pF1KSD MPRKKAAAAAWEEPSSGNGTARAGPRKRGGPAGRKRERPERCSSSSGGGSSGDEDGLELD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 MPRKKAAAAAWEEPSSGNGTARAGPRKRGGPAGRKRERPERCSSSSGGGSSGDEDGLELD 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD GAPGGGKRAARPATAGKAGGAAVVITEPEHTKERVKLEGSKCKGQLLIFGATNWDLIGRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 GAPGGGKRAARPATAGKAGGAAVVITEPEHTKERVKLEGSKCKGQLLIFGATNWDLIGRK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD EVPKQQAAYRNLGQNLWGPHRYGCLAGVRVRTVVSGSCAAHSLLITTEGKLWSWGRNEKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 EVPKQQAAYRNLGQNLWGPHRYGCLAGVRVRTVVSGSCAAHSLLITTEGKLWSWGRNEKG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD QLGHGDTKRVEAPRLIEGLSHEVIVSAACGRNHTLALTETGSVFAFGENKMGQLGLGNQT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 QLGHGDTKRVEAPRLIEGLSHEVIVSAACGRNHTLALTETGSVFAFGENKMGQLGLGNQT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD DAVPSPAQIMYNGQPITKMACGAEFSMIMDCKGNLYSFGCPEYGQLGHNSDGKFIARAQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 DAVPSPAQIMYNGQPITKMACGAEFSMIMDCKGNLYSFGCPEYGQLGHNSDGKFIARAQR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD IEYDCELVPRRVAIFIEKTKDGQILPVPNVVVRDVACGANHTLVLDSQKRVFSWGFGGYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 IEYDCELVPRRVAIFIEKTKDGQILPVPNVVVRDVACGANHTLVLDSQKRVFSWGFGGYG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD RLGHAEQKDEMVPRLVKLFDFPGRGASQIYAGYTCSFAVSEVGGLFFWGATNTSRESTMY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 RLGHAEQKDEMVPRLVKLFDFPGRGASQIYAGYTCSFAVSEVGGLFFWGATNTSRESTMY 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD PKAVQDLCGWRIRSLACGKSSIIVAADESTISWGPSPTFGELGYGDHKPKSSTAAQEVKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 PKAVQDLCGWRIRSLACGKSSIIVAADESTISWGPSPTFGELGYGDHKPKSSTAAQEVKT 430 440 450 460 470 480 490 500 510 520 pF1KSD LDGIFSEQVAMGYSHSLVIARDESETEKEKIKKLPEYNPRTL :::::::::::::::::::::::::::::::::::::::::: CCDS18 LDGIFSEQVAMGYSHSLVIARDESETEKEKIKKLPEYNPRTL 490 500 510 520 >>CCDS323.1 RCC1 gene_id:1104|Hs108|chr1 (421 aa) initn: 347 init1: 111 opt: 394 Z-score: 363.8 bits: 76.6 E(32554): 6.1e-14 Smith-Waterman score: 394; 24.8% identity (58.1% similar) in 387 aa overlap (132-506:50-421) 110 120 130 140 150 160 pF1KSD CKGQLLIFGATNWDLIGRKEVPKQQAAYRNLGQNLWGPHRYGCLAGVRVRTVVSGSCAAH ::.:. .. :... .: . . . : CCDS32 SKKVKVSHRSHSTEPGLVLTLGQGDVGQLGLGENVM-ERKKPALVSIPEDVVQAEAGGMH 20 30 40 50 60 70 170 180 190 200 210 pF1KSD SLLITTEGKLWSWGRNEKGQLGHGDTKRVEAPRLIEGLS--HEVIVSAACGRNHTLALTE .. .. :...:.: :..: ::. ::. ::. ... : .: .:... : .:: :::. CCDS32 TVCLSKSGQVYSFGCNDEGALGR-DTS-VEGSEMVPGKVELQEKVVQVSAGDSHTAALTD 80 90 100 110 120 130 220 230 240 250 260 270 pF1KSD TGSVFAFG--ENKMGQLGLGNQTDAVPSPAQIMYNGQPITKMACGAEFSMIMDCKGNLYS : :: .: ... : .:: . :.:.. . :..:.: : . ... :.::. CCDS32 DGRVFLWGSFRDNNGVIGLLEPMKKSMVPVQVQLD-VPVVKVASGNDHLVMLTADGDLYT 140 150 160 170 180 190 280 290 300 310 320 330 pF1KSD FGCPEYGQLGHNSDGKFIARAQRIEYDCELVPRRVAIFIEKTKDGQILPVPNVVVRDVAC .:: : ::::. . : :. : . :::. : . :.. .. .: .:. : CCDS32 LGCGEQGQLGRVPE-LFANRGGRQGLERLLVPKCVML---KSRGSR----GHVRFQDAFC 200 210 220 230 240 340 350 360 370 380 390 pF1KSD GANHTLVLDSQKRVFSWGFGGYGRLGHAEQKDEMVPRLVKLFDFPGRGASQIYAGYTCSF :: :.... . .:...:...: .:: .. ..:. . : .. . .: . CCDS32 GAYFTFAISHEGHVYGFGLSNYHQLGTPGTESCFIPQNLTSFKNSTKSWVGFSGGQHHTV 250 260 270 280 290 300 400 410 420 430 440 pF1KSD AVSEVGGLFFWGATNTSR-------ESTMYPKAVQDLCGWRIRSLACGKS-SIIVAADES .. : . : .. .: : : .. : . . :.::: : . :. : CCDS32 CMDSEGKAYSLGRAEYGRLGLGEGAEEKSIPTLISRLPA--VSSVACGASVGYAVTKDGR 310 320 330 340 350 360 450 460 470 480 490 500 pF1KSD TISWGPSPTFGELGYGDHKPKSSTAAQEVKTLDGIFSEQVAMGYSHSLVIARDESETEKE ...:: . .. .:: :. . : . . : :.. .:. : .:......:. .. CCDS32 VFAWGMGTNY-QLGTGQDEDAWSPVEMMGKQLENRVVLSVSSGGQHTVLLVKDKEQS 370 380 390 400 410 420 510 520 pF1KSD KIKKLPEYNPRTL >>CCDS41295.1 RCC1 gene_id:1104|Hs108|chr1 (452 aa) initn: 347 init1: 111 opt: 394 Z-score: 363.3 bits: 76.7 E(32554): 6.4e-14 Smith-Waterman score: 394; 24.8% identity (58.1% similar) in 387 aa overlap (132-506:81-452) 110 120 130 140 150 160 pF1KSD CKGQLLIFGATNWDLIGRKEVPKQQAAYRNLGQNLWGPHRYGCLAGVRVRTVVSGSCAAH ::.:. .. :... .: . . . : CCDS41 QKTRPVSHRSHSTEPGLVLTLGQGDVGQLGLGENVM-ERKKPALVSIPEDVVQAEAGGMH 60 70 80 90 100 170 180 190 200 210 pF1KSD SLLITTEGKLWSWGRNEKGQLGHGDTKRVEAPRLIEGLS--HEVIVSAACGRNHTLALTE .. .. :...:.: :..: ::. ::. ::. ... : .: .:... : .:: :::. CCDS41 TVCLSKSGQVYSFGCNDEGALGR-DTS-VEGSEMVPGKVELQEKVVQVSAGDSHTAALTD 110 120 130 140 150 160 220 230 240 250 260 270 pF1KSD TGSVFAFG--ENKMGQLGLGNQTDAVPSPAQIMYNGQPITKMACGAEFSMIMDCKGNLYS : :: .: ... : .:: . :.:.. . :..:.: : . ... :.::. CCDS41 DGRVFLWGSFRDNNGVIGLLEPMKKSMVPVQVQLD-VPVVKVASGNDHLVMLTADGDLYT 170 180 190 200 210 220 280 290 300 310 320 330 pF1KSD FGCPEYGQLGHNSDGKFIARAQRIEYDCELVPRRVAIFIEKTKDGQILPVPNVVVRDVAC .:: : ::::. . : :. : . :::. : . :.. .. .: .:. : CCDS41 LGCGEQGQLGRVPE-LFANRGGRQGLERLLVPKCVML---KSRGSR----GHVRFQDAFC 230 240 250 260 270 340 350 360 370 380 390 pF1KSD GANHTLVLDSQKRVFSWGFGGYGRLGHAEQKDEMVPRLVKLFDFPGRGASQIYAGYTCSF :: :.... . .:...:...: .:: .. ..:. . : .. . .: . CCDS41 GAYFTFAISHEGHVYGFGLSNYHQLGTPGTESCFIPQNLTSFKNSTKSWVGFSGGQHHTV 280 290 300 310 320 330 400 410 420 430 440 pF1KSD AVSEVGGLFFWGATNTSR-------ESTMYPKAVQDLCGWRIRSLACGKS-SIIVAADES .. : . : .. .: : : .. : . . :.::: : . :. : CCDS41 CMDSEGKAYSLGRAEYGRLGLGEGAEEKSIPTLISRLPA--VSSVACGASVGYAVTKDGR 340 350 360 370 380 390 450 460 470 480 490 500 pF1KSD TISWGPSPTFGELGYGDHKPKSSTAAQEVKTLDGIFSEQVAMGYSHSLVIARDESETEKE ...:: . .. .:: :. . : . . : :.. .:. : .:......:. .. CCDS41 VFAWGMGTNY-QLGTGQDEDAWSPVEMMGKQLENRVVLSVSSGGQHTVLLVKDKEQS 400 410 420 430 440 450 510 520 pF1KSD KIKKLPEYNPRTL >>CCDS45277.1 HERC1 gene_id:8925|Hs108|chr15 (4861 aa) initn: 431 init1: 286 opt: 365 Z-score: 322.6 bits: 72.6 E(32554): 1.2e-11 Smith-Waterman score: 456; 33.0% identity (60.8% similar) in 288 aa overlap (145-398:4076-4357) 120 130 140 150 160 170 pF1KSD DLIGRKEVPKQQAAYRNLGQNLWGPHRYGCLAGVRVRTVVSGSCAA--HSLLITTEGKLW : : : .:. ::.. ::. .: :... CCDS45 GTVLACGEGSYGRLGQGNSDDLHVLTVISALQGFVVTQLVT-SCGSDGHSMALTESGEVF 4050 4060 4070 4080 4090 4100 180 190 200 210 220 230 pF1KSD SWGRNEKGQLGHGDTKRVEAPRLIEGLSHEVIVSAACGRNHTLALTETGSVFAFGENKMG ::: .. :.::::.. : . :: ::.:. : .:. .:: .:. ..: :..:.::.. .: CCDS45 SWGDGDYGKLGHGNSDRQRRPRQIEALQGEEVVQMSCGFKHSAVVTSDGKLFTFGNGDYG 4110 4120 4130 4140 4150 4160 240 250 260 270 280 pF1KSD QLGLGNQTDAVPSPAQIM-YNGQPITKMACGAEFSMIMDCKGNL-YSFGCPEYGQLG-HN .::::: .. : .. .: : ..::: . .. .. :.. ..:: .::.:: : CCDS45 RLGLGNTSNK-KLPERVTALEGYQIGQVACGLNHTLAVSADGSMVWAFGDGDYGKLGLGN 4170 4180 4190 4200 4210 4220 290 300 310 320 pF1KSD SDGKFIARAQRIEYDCELVPRRVA----IFIEKTKDGQI----------LP--------- : .: . :.:. : . ..:: . . ::::.. :: CCDS45 STAK--SSPQKIDVLCGIGIKKVACGTQFSVALTKDGHVYTFGQDRLIGLPEGRARNHNR 4230 4240 4250 4260 4270 4280 330 340 350 360 370 380 pF1KSD ---VP---NVVVRDVACGANHTLVLDSQKRVFSWGFGGYGRLGHAEQKDEMVPRLVKLFD .: .:...::: ::.:::.: :. :..:: .. :.:: .. . : :: CCDS45 PQQIPVLAGVIIEDVAVGAEHTLALASNGDVYAWGSNSEGQLGLGHTNHVREPTLVT--G 4290 4300 4310 4320 4330 390 400 410 420 430 440 pF1KSD FPGRGASQIYAGYTCSFAVSEVGGLFFWGATNTSRESTMYPKAVQDLCGWRIRSLACGKS . :... :: :: : : CCDS45 LQGKNVRQISAGRCHSAAWTAPPVPPRAPGVSVPLQLGLPDTVPPQYGALREVSIHTVRA 4340 4350 4360 4370 4380 4390 >>CCDS82939.1 HERC3 gene_id:8916|Hs108|chr4 (368 aa) initn: 446 init1: 263 opt: 346 Z-score: 321.5 bits: 68.6 E(32554): 1.4e-11 Smith-Waterman score: 447; 28.6% identity (58.7% similar) in 346 aa overlap (132-465:14-330) 110 120 130 140 150 pF1KSD CKGQLLIFGATNWDLIGRKEVPKQQAAYRNLGQNLWG----PHRYGCLAGVRVRTVVSGS .. :: : :. : .. :. :. : CCDS82 MLCWGYWSLGQPGISTNLQGIVAEPQVCGFISDRSVKEVACG- 10 20 30 40 160 170 180 190 200 210 pF1KSD CAAHSLLITTEGKLWSWGRNEKGQLGHGDTKRVEAPRLIEGLSHEVIVSAACGRNHTLAL . ::... .:.... : : :::::: .. . :. : .:. . :. .:::..:.::: CCDS82 -GNHSVFLLEDGEVYTCGLNTKGQLGH--EREGNKPEQIGALADQHIIHVACGESHSLAL 50 60 70 80 90 220 230 240 250 260 270 pF1KSD TETGSVFAFGENKMGQLGLGNQTDAVPSPAQIM-YNGQPITKMACGAEFSMIMDCKGNLY .. :..:..: .. ::::: . :.: : :. : : : ...:: . . :... CCDS82 SDRGQLFSWGAGSDGQLGLMTTEDSVAVPRLIQKLNQQTILQVSCGNWHCLALAADGQFF 100 110 120 130 140 150 280 290 300 310 320 330 pF1KSD SFGCPEYGQLGHNSDGKFIARAQRIEYDCELVPRRVAIFIEKTKDGQILPVPNVVVRDVA ..: .:::: :: :. . :.:: .. .: .: . .:: CCDS82 TWGKNSHGQLGL---GK--------EFPSQASPQRV-----RSLEG----IP---LAQVA 160 170 180 190 340 350 360 370 380 390 pF1KSD CGANHTLVLDSQKRVFSWGFGGYGRLGHAEQKDEMVPRLVKLFDFPGRGASQIYAGYTCS :. :...:. . ::.::... :.:: ...::. : :::. . . : : . CCDS82 AGGAHSFALSLSGAVFGWGMNNAGQLGLSDEKDRESPCHVKLLR--TQKVVYISCGEEHT 200 210 220 230 240 250 400 410 420 430 440 450 pF1KSD FAVSEVGGLFFWGATNT------SRESTMYPKAVQDLCGWRIRSLACGKSSIIVAADEST .... ::.: .:: . : .. . :. : .: : .. ..:::.. .. . : CCDS82 AVLTKSGGVFTFGAGSCGQLGHDSMNDEVNPRRVLELMGSEVTQIACGRQHTLAFVPSSG 260 270 280 290 300 310 460 470 480 490 500 pF1KSD ISWG-PSPTFGELGYGDHKPKSSTAAQEVKTLDGIFSEQVAMGYSHSLVIARDESETEKE . .. . :.:: : CCDS82 LIYAFGCGARGQLGTGHTCNVKCPSPVKGYWAAHSGQLSARAGKNDCLWNLKVF 320 330 340 350 360 >>CCDS34028.1 HERC3 gene_id:8916|Hs108|chr4 (1050 aa) initn: 320 init1: 263 opt: 346 Z-score: 315.1 bits: 68.9 E(32554): 3.1e-11 Smith-Waterman score: 447; 28.6% identity (58.7% similar) in 346 aa overlap (132-465:14-330) 110 120 130 140 150 pF1KSD CKGQLLIFGATNWDLIGRKEVPKQQAAYRNLGQNLWG----PHRYGCLAGVRVRTVVSGS .. :: : :. : .. :. :. : CCDS34 MLCWGYWSLGQPGISTNLQGIVAEPQVCGFISDRSVKEVACG- 10 20 30 40 160 170 180 190 200 210 pF1KSD CAAHSLLITTEGKLWSWGRNEKGQLGHGDTKRVEAPRLIEGLSHEVIVSAACGRNHTLAL . ::... .:.... : : :::::: .. . :. : .:. . :. .:::..:.::: CCDS34 -GNHSVFLLEDGEVYTCGLNTKGQLGH--EREGNKPEQIGALADQHIIHVACGESHSLAL 50 60 70 80 90 220 230 240 250 260 270 pF1KSD TETGSVFAFGENKMGQLGLGNQTDAVPSPAQIM-YNGQPITKMACGAEFSMIMDCKGNLY .. :..:..: .. ::::: . :.: : :. : : : ...:: . . :... CCDS34 SDRGQLFSWGAGSDGQLGLMTTEDSVAVPRLIQKLNQQTILQVSCGNWHCLALAADGQFF 100 110 120 130 140 150 280 290 300 310 320 330 pF1KSD SFGCPEYGQLGHNSDGKFIARAQRIEYDCELVPRRVAIFIEKTKDGQILPVPNVVVRDVA ..: .:::: :: :. . :.:: .. .: .: . .:: CCDS34 TWGKNSHGQLGL---GK--------EFPSQASPQRV-----RSLEG----IP---LAQVA 160 170 180 190 340 350 360 370 380 390 pF1KSD CGANHTLVLDSQKRVFSWGFGGYGRLGHAEQKDEMVPRLVKLFDFPGRGASQIYAGYTCS :. :...:. . ::.::... :.:: ...::. : :::. . . : : . CCDS34 AGGAHSFALSLSGAVFGWGMNNAGQLGLSDEKDRESPCHVKLLR--TQKVVYISCGEEHT 200 210 220 230 240 250 400 410 420 430 440 450 pF1KSD FAVSEVGGLFFWGATNT------SRESTMYPKAVQDLCGWRIRSLACGKSSIIVAADEST .... ::.: .:: . : .. . :. : .: : .. ..:::.. .. . : CCDS34 AVLTKSGGVFTFGAGSCGQLGHDSMNDEVNPRRVLELMGSEVTQIACGRQHTLAFVPSSG 260 270 280 290 300 310 460 470 480 490 500 pF1KSD ISWG-PSPTFGELGYGDHKPKSSTAAQEVKTLDGIFSEQVAMGYSHSLVIARDESETEKE . .. . :.:: : CCDS34 LIYAFGCGARGQLGTGHTCNVKCPSPVKGYWAAHSGQLSARADRFKYHIVKQIFSGGDQT 320 330 340 350 360 370 522 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 06:24:31 2016 done: Thu Nov 3 06:24:31 2016 Total Scan time: 3.040 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]