FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1957, 421 aa 1>>>pF1KSDA1957 421 - 421 aa - 421 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.2811+/-0.000771; mu= 5.1217+/- 0.046 mean_var=172.8237+/-34.798, 0's: 0 Z-trim(114.5): 15 B-trim: 0 in 0/52 Lambda= 0.097560 statistics sampled from 15088 (15097) to 15088 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.777), E-opt: 0.2 (0.464), width: 16 Scan time: 3.860 The best scores are: opt bits E(32554) CCDS45890.1 C2CD4C gene_id:126567|Hs108|chr19 ( 421) 2784 403.5 2e-112 CCDS32259.1 C2CD4B gene_id:388125|Hs108|chr15 ( 364) 504 82.5 7.2e-16 CCDS32258.1 C2CD4A gene_id:145741|Hs108|chr15 ( 369) 498 81.7 1.3e-15 CCDS44224.1 C2CD4D gene_id:100191040|Hs108|chr1 ( 353) 383 65.5 9.5e-11 >>CCDS45890.1 C2CD4C gene_id:126567|Hs108|chr19 (421 aa) initn: 2784 init1: 2784 opt: 2784 Z-score: 2131.7 bits: 403.5 E(32554): 2e-112 Smith-Waterman score: 2784; 100.0% identity (100.0% similar) in 421 aa overlap (1-421:1-421) 10 20 30 40 50 60 pF1KSD MRKTNMWFLERLRGSGENGAARGVGSEAGDKASKGPLYSNVLTPDKIPDFFIPPKLPSGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 MRKTNMWFLERLRGSGENGAARGVGSEAGDKASKGPLYSNVLTPDKIPDFFIPPKLPSGP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD AEGEGQAALGPSTSEQNLASAAPRQTPRSPRLPAKLAAESKSLLKAATRHVIQIESAEDW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 AEGEGQAALGPSTSEQNLASAAPRQTPRSPRLPAKLAAESKSLLKAATRHVIQIESAEDW 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD LSEEATDADPQAQGAMSLPSVPKAQTSYGFAMLAESPHTRRKESLFHSEHGALAQVGSPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 LSEEATDADPQAQGAMSLPSVPKAQTSYGFAMLAESPHTRRKESLFHSEHGALAQVGSPG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD AGRRRAAAKANGGDGGPREAGGALMSPGRYFSGGESDTGSSAESSPFGSPLLSRSVSLLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 AGRRRAAAKANGGDGGPREAGGALMSPGRYFSGGESDTGSSAESSPFGSPLLSRSVSLLK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD GFAQDSQAKVSQLRHSVGRHGSLSADDSTPDASPGSRRRLTRRAPPEPGPESGQARGEHT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 GFAQDSQAKVSQLRHSVGRHGSLSADDSTPDASPGSRRRLTRRAPPEPGPESGQARGEHT 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD VHVGPRGSVRLLAEYEAGQARLRVHLLAAEGLYDRLCDARSINCCVGLCLVPGKLQKQRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 VHVGPRGSVRLLAEYEAGQARLRVHLLAAEGLYDRLCDARSINCCVGLCLVPGKLQKQRS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD TIVKNSRRPVFNEDFFFDGLGPASVRKLALRIKVVNKGSSLKRDTLLGEKELPLTSLLPF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 TIVKNSRRPVFNEDFFFDGLGPASVRKLALRIKVVNKGSSLKRDTLLGEKELPLTSLLPF 370 380 390 400 410 420 pF1KSD L : CCDS45 L >>CCDS32259.1 C2CD4B gene_id:388125|Hs108|chr15 (364 aa) initn: 580 init1: 184 opt: 504 Z-score: 398.3 bits: 82.5 E(32554): 7.2e-16 Smith-Waterman score: 589; 35.9% identity (56.7% similar) in 404 aa overlap (26-418:10-362) 10 20 30 40 50 60 pF1KSD MRKTNMWFLERLRGSGENGAARGVGSEAGDKASKGPLYSNVLTPDKIPDFFIPPKLPSGP : ::..: : : ...::::..::.: :::.::. CCDS32 MRLLEKLCSSAAGSSAPK-PAFAKVLTPNRIPEFCIPPRLPA-- 10 20 30 40 70 80 90 100 110 120 pF1KSD AEGEGQAALGPSTSEQNLASAAPRQTPRSPRLPAKLAAESKSLLKAATRHVIQIESAEDW : : :. . .:: .: . :::: .:: . . . :: CCDS32 ----------PCTLESPIRAAA---------VPRRCAAESDLWPRAADEDA----GRTDW 50 60 70 130 140 150 160 170 180 pF1KSD LSEEATDADPQAQGAMSLPSVPKAQTSYGFAMLAESPHTRRKESLFHSEHGALAQVGSPG ::..:.:.::: .:...:.::: : :::::::::::. .:.: CCDS32 --------DPRSQAALSLPHLPRVRTTYGFCALLESPHTRRKESLL---------LGGPP 80 90 100 110 120 190 200 210 220 230 pF1KSD AGRRRAAAKANGGDGGPREAGGALMSP---GRYFS---GGESDTGSSAESSPFGSPLLSR : : :: .. :: ::: :.: .: : :: .. ..: :: CCDS32 APRPRA--HSCGGGGGPDAPLGTLCGPRGPGPATPAAPGGPRLPQDALAAGPRRCRLLRV 130 140 150 160 170 240 250 260 270 280 290 pF1KSD SVSLL-KGFAQDSQAKVSQLRH-SVGRHGSLS-ADDSTPDASPGSRRRLTRRAPPEPGPE .:: ... . .....: : : . : . .: .:.: :. ::: :: CCDS32 PDGLLSRALRAGRSRRLARVRSVSSGNEDEERRAGSESPARAPSSSP-LSSRAP---LPE 180 190 200 210 220 230 300 310 320 330 340 350 pF1KSD SGQARGEHTVHVGPRG-SVRLLAEYEAGQARLRVHLLAAEGLYDRLCDARSINCCVGLCL .:.: :: .: : ..:: ::: : :::..:: ::.:. :.. : ..: : CCDS32 RLEAKG--TVALGRAGDALRLAAEYCPGTRRLRLRLLRAESLFGGAPGPRAVRCRLSLVL 240 250 260 270 280 290 360 370 380 390 400 pF1KSD VP-GKLQKQRSTIVKNSRRPVFNEDFFFDGLGPASVRKLALRIKVVNKGSSLKRDTLLGE : : . : :..: ::. :..:: ::::. ::.::.:.:. ..: . : :::. CCDS32 RPPGTARWQCSAVVGRSRKASFDQDFCFDGLSEDEVRRLAVRVKARDEGRGRDRGRLLGQ 300 310 320 330 340 350 410 420 pF1KSD KELPLTSLLPFL :: : .:: CCDS32 GELSLGALLLL 360 >>CCDS32258.1 C2CD4A gene_id:145741|Hs108|chr15 (369 aa) initn: 576 init1: 193 opt: 498 Z-score: 393.7 bits: 81.7 E(32554): 1.3e-15 Smith-Waterman score: 544; 34.4% identity (52.0% similar) in 427 aa overlap (6-418:1-367) 10 20 30 40 50 pF1KSD MRKTNMWFLERLRGSGENGAARG----VGSEAGDKASKGPLYSNVLTPDKIPDFFIPPKL :: ::::: . : : : : :. .::::::.::.: :::.: CCDS32 MWCLERLRLGPECLRRSGDWLLPGRARGAKSRTTAACANVLTPDRIPEFCIPPRL 10 20 30 40 50 60 70 80 90 100 110 pF1KSD PSGPAEGEGQAALGPSTSEQNLASAAPRQTPRSPRLPAKLAAESKSLLKAATRHVIQIES ::: ::: .: .. : . . . CCDS32 --------------------------------MPRLA--LAALRNSWVEEAG--MDEGAG 60 70 120 130 140 150 160 170 pF1KSD AEDWLSEEATDADPQAQGAMSLPSVPKAQTSYGFAMLAESPHTRRKESLFHSEHGALAQV :: ::..:.:.::: .:...:.::: : :::::::::::. . CCDS32 RTDW--------DPRSQAALSLPHLPRVRTAYGFCALLESPHTRRKESLL---------L 80 90 100 110 120 180 190 200 210 220 230 pF1KSD GSPGAGRRRAAAKANGGDGGPREAGGALMSPGRYFSGGESDTGSSAESSPFGSPLLSR-- :.: : : :: .. :: ::: :.: : : . : . .. . : . : : CCDS32 GGPPAPRPRA--HTYGGGGGPDALLGTLRVP-R--APGPATPAAPGCPRPPQDALARRPR 130 140 150 160 170 240 250 260 270 280 pF1KSD SVSLLK---GFAQDSQAKVSQLRHSVGRHGSLSADDSTPDASPGSRRRLTRRAPPE---P . ::. :. . . . : . : : . .:. :. : : .:: : CCDS32 GCRLLRVPDGLLSRALRAGRSRRLTRVRSVSSGNEDKERRAGSQSPARAPSTSPPSSRVP 180 190 200 210 220 230 290 300 310 320 330 340 pF1KSD GPESGQARGEHTVHVGPRG-SVRLLAEYEAGQARLRVHLLAAEGLYDRLCDARSINCCVG :: .:.: :: .: : ..:: ::: : .:::..:: ::. :...: .. CCDS32 FPERLEAEG--TVALGRAGDALRLAAEYCPGTGRLRLRLLRAESPAGGAPGPRAVSCRLS 240 250 260 270 280 290 350 360 370 380 390 400 pF1KSD LCLVP-GKLQKQRSTIVKNSRRPVFNEDFFFDGLGPASVRKLALRIKVVNKGSSLKRDTL : : : : .: ::.: ::. :..:: ::::. ::.::.:.:. ..: . .: : CCDS32 LVLRPPGTALRQCSTVVGRSRKASFDQDFCFDGLSEDEVRRLAVRVKARDEGRGRERGRL 300 310 320 330 340 350 410 420 pF1KSD LGEKELPLTSLLPFL ::. :: : .:: CCDS32 LGQGELSLGALLLL 360 >>CCDS44224.1 C2CD4D gene_id:100191040|Hs108|chr1 (353 aa) initn: 646 init1: 234 opt: 383 Z-score: 306.5 bits: 65.5 E(32554): 9.5e-11 Smith-Waterman score: 538; 35.0% identity (52.4% similar) in 431 aa overlap (6-421:1-336) 10 20 30 40 50 pF1KSD MRKTNMWFLERLR---GSGENGAARGVGSEAGDKASKGPLYS---NVLTPDKIPDFFIPP ::.::. :..: .: . .. . . . :: : ::::::.::.::::: CCDS44 MWLLEKAGYKVGAAEPAARWAPSGLFSKRRAPGPPTSACPNVLTPDRIPQFFIPP 10 20 30 40 50 60 70 80 90 100 110 pF1KSD KLPSGPAEGEGQAALGPSTSEQNLASAAPRQTPRSPRLPAKLAAESKSLLKAATRHVIQI .::. :. .:.: :: ::: CCDS44 RLPD------------PG-------GAVP----------------------AARRHVA-- 60 70 120 130 140 150 160 170 pF1KSD ESAEDWLSEEATDADPQAQGAMSLPSVPKAQTSYGFAMLAESPHTRRKESLFHSEHGALA ..: . :.:. :.:.: :::::::.:::::. : : CCDS44 -----------------GRGLPATCSLPHLAGREGWAFLPESPHTRRRESLFHGPPPAPA 80 90 100 110 180 190 200 210 220 230 pF1KSD QVGSPGAGRRRAAAKANGGDGGPREAGGALMSPGRYFSGGESDTGSSAESSPFGSPLLSR : :.: : .. . : . .:::.:: .::::::: CCDS44 G-GLPAAQSRLHVSAPDL----------------RLCRAPDSDTASSPDSSPFGSPR--- 120 130 140 150 240 250 260 270 280 290 pF1KSD SVSLLKGFAQDSQAKVSQLRHSVGRHGSLSADD-STPDASPGSRRRLTRRAPPEPGPE-- :.. :. :.: ::: . :. :.:: : :: .:: . CCDS44 -----PGLG----------RRRVSRPHSLSPEKASSADTSPHSPRRAGPPTPPLFHLDFL 160 170 180 190 200 300 310 320 330 340 pF1KSD SGQARG--EHTVHVGPRGS-VRLLAEYEAGQARLRVHLLAAEGLYDRLCDARSIN--CCV : : : ....::::. .:: .::.:: .:::..:..:::: : . ::: CCDS44 CCQLRPTRESVLRLGPRGGQLRLSTEYQAGPGRLRLRLVSAEGLPRPRSRPGSGGGGCCV 210 220 230 240 250 260 350 360 370 380 390 400 pF1KSD GLCLVPG-KLQKQRSTIVKNSRRPVFNEDFFFDGLGPASVRKLALRIKVVNKGSSLKRDT : : : . ..:.: .:: : :.:::::::::::: .. .:: ::...:..:.::. CCDS44 VLRLRPRVRPREQQSRVVKCSANPIFNEDFFFDGLGPPDLAARSLRAKVLDRGAGLRRDV 270 280 290 300 310 320 410 420 pF1KSD LLGEKELPLTSLLPFL :::: : :: .::: : CCDS44 LLGECETPLIALLPPLGGGLGPGSSLAPTHLSL 330 340 350 421 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 07:48:37 2016 done: Thu Nov 3 07:48:37 2016 Total Scan time: 3.860 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]