FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9592, 593 aa 1>>>pF1KB9592 593 - 593 aa - 593 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.6536+/-0.000819; mu= 12.3759+/- 0.049 mean_var=86.7932+/-17.447, 0's: 0 Z-trim(108.8): 14 B-trim: 0 in 0/52 Lambda= 0.137667 statistics sampled from 10410 (10421) to 10410 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.682), E-opt: 0.2 (0.32), width: 16 Scan time: 3.520 The best scores are: opt bits E(32554) CCDS7230.1 PGBD3 gene_id:267004|Hs108|chr10 ( 593) 4078 819.9 0 CCDS60529.1 ERCC6 gene_id:2074|Hs108|chr10 (1061) 4078 820.0 0 CCDS31128.1 PGBD2 gene_id:267002|Hs108|chr1 ( 592) 1506 309.1 1e-83 CCDS4648.1 PGBD1 gene_id:84547|Hs108|chr6 ( 809) 1137 235.9 1.6e-61 CCDS31129.1 PGBD2 gene_id:267002|Hs108|chr1 ( 341) 1047 217.9 1.7e-56 >>CCDS7230.1 PGBD3 gene_id:267004|Hs108|chr10 (593 aa) initn: 4078 init1: 4078 opt: 4078 Z-score: 4377.3 bits: 819.9 E(32554): 0 Smith-Waterman score: 4078; 99.8% identity (100.0% similar) in 593 aa overlap (1-593:1-593) 10 20 30 40 50 60 pF1KB9 MPRTLSLHEITDLLETDDSIEASAIVIQPPENATAPVSDEESGDEEGGTINNLPGSLLHT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 MPRTLSLHEITDLLETDDSIEASAIVIQPPENATAPVSDEESGDEEGGTINNLPGSLLHT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 AAYLIQDGSDAESDSDDPSYAPKDDSPDEVPSTFTVQQPPPSRRRKMTKILCKWKKADLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 AAYLIQDGSDAESDSDDPSYAPKDDSPDEVPSTFTVQQPPPSRRRKMTKILCKWKKADLT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 VQPVAGRVTAPPNDFFTVMRTPTEILELFLDDEVIELIVKYSNLYACSKGVHLGLTSSEF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 VQPVAGRVTAPPNDFFTVMRTPTEILELFLDDEVIELIVKYSNLYACSKGVHLGLTSSEF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 KCFLGIIFLSGYVSVPRRRMFWEQRTDVHNVLVSAAMRRDRFETIFSNLHVADNANLDPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 KCFLGIIFLSGYVSVPRRRMFWEQRTDVHNVLVSAAMRRDRFETIFSNLHVADNANLDPV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 DKFSKLRPLISKLNERCMKFVPNETYFSFDEFMVPYFGRHGCKQFIRGKPIRFGYKFWCG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 DKFSKLRPLISKLNERCMKFVPNETYFSFDEFMVPYFGRHGCKQFIRGKPIRFGYKFWCG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 ATCLGYICWFQPYQGKNPNTKHEEYGVGASLVLQFSEALTEAHPGQYHFVFNNFFTSIAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 ATCLGYICWFQPYQGKNPNTKHEEYGVGASLVLQFSEALTEAHPGQYHFVFNNFFTSIAL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 LDKLSSMGHQATGTVRKDHIDKVPLESDVALKKKERGTFDYRIDGKGNIVCRWNDNSVVT :::::::::::::::::::::.:::::::::::::::::::::::::::::::::::::: CCDS72 LDKLSSMGHQATGTVRKDHIDRVPLESDVALKKKERGTFDYRIDGKGNIVCRWNDNSVVT 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB9 VASSGAGIHPLCLVSRYSQKLKKKIQVQQPNMIKVYNQFMGGVDRADENIDKYRASIRGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 VASSGAGIHPLCLVSRYSQKLKKKIQVQQPNMIKVYNQFMGGVDRADENIDKYRASIRGK 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB9 KWYSSPLLFCFELVLQNAWQLHKTYDEKPVDFLEFRRRVVCHYLETHGHPPEPGQKGRPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 KWYSSPLLFCFELVLQNAWQLHKTYDEKPVDFLEFRRRVVCHYLETHGHPPEPGQKGRPQ 490 500 510 520 530 540 550 560 570 580 590 pF1KB9 KRNIDSRYDGINHVIVKQGKQTRCAECHKNTTFRCEKCDVALHVKCSVEYHTE ::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 KRNIDSRYDGINHVIVKQGKQTRCAECHKNTTFRCEKCDVALHVKCSVEYHTE 550 560 570 580 590 >>CCDS60529.1 ERCC6 gene_id:2074|Hs108|chr10 (1061 aa) initn: 4078 init1: 4078 opt: 4078 Z-score: 4373.1 bits: 820.0 E(32554): 0 Smith-Waterman score: 4078; 99.8% identity (100.0% similar) in 593 aa overlap (1-593:469-1061) 10 20 30 pF1KB9 MPRTLSLHEITDLLETDDSIEASAIVIQPP :::::::::::::::::::::::::::::: CCDS60 VGEGGGGGRKVGRYRDDGDEDYYKQRLSPKMPRTLSLHEITDLLETDDSIEASAIVIQPP 440 450 460 470 480 490 40 50 60 70 80 90 pF1KB9 ENATAPVSDEESGDEEGGTINNLPGSLLHTAAYLIQDGSDAESDSDDPSYAPKDDSPDEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 ENATAPVSDEESGDEEGGTINNLPGSLLHTAAYLIQDGSDAESDSDDPSYAPKDDSPDEV 500 510 520 530 540 550 100 110 120 130 140 150 pF1KB9 PSTFTVQQPPPSRRRKMTKILCKWKKADLTVQPVAGRVTAPPNDFFTVMRTPTEILELFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 PSTFTVQQPPPSRRRKMTKILCKWKKADLTVQPVAGRVTAPPNDFFTVMRTPTEILELFL 560 570 580 590 600 610 160 170 180 190 200 210 pF1KB9 DDEVIELIVKYSNLYACSKGVHLGLTSSEFKCFLGIIFLSGYVSVPRRRMFWEQRTDVHN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 DDEVIELIVKYSNLYACSKGVHLGLTSSEFKCFLGIIFLSGYVSVPRRRMFWEQRTDVHN 620 630 640 650 660 670 220 230 240 250 260 270 pF1KB9 VLVSAAMRRDRFETIFSNLHVADNANLDPVDKFSKLRPLISKLNERCMKFVPNETYFSFD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 VLVSAAMRRDRFETIFSNLHVADNANLDPVDKFSKLRPLISKLNERCMKFVPNETYFSFD 680 690 700 710 720 730 280 290 300 310 320 330 pF1KB9 EFMVPYFGRHGCKQFIRGKPIRFGYKFWCGATCLGYICWFQPYQGKNPNTKHEEYGVGAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 EFMVPYFGRHGCKQFIRGKPIRFGYKFWCGATCLGYICWFQPYQGKNPNTKHEEYGVGAS 740 750 760 770 780 790 340 350 360 370 380 390 pF1KB9 LVLQFSEALTEAHPGQYHFVFNNFFTSIALLDKLSSMGHQATGTVRKDHIDKVPLESDVA :::::::::::::::::::::::::::::::::::::::::::::::::::.:::::::: CCDS60 LVLQFSEALTEAHPGQYHFVFNNFFTSIALLDKLSSMGHQATGTVRKDHIDRVPLESDVA 800 810 820 830 840 850 400 410 420 430 440 450 pF1KB9 LKKKERGTFDYRIDGKGNIVCRWNDNSVVTVASSGAGIHPLCLVSRYSQKLKKKIQVQQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 LKKKERGTFDYRIDGKGNIVCRWNDNSVVTVASSGAGIHPLCLVSRYSQKLKKKIQVQQP 860 870 880 890 900 910 460 470 480 490 500 510 pF1KB9 NMIKVYNQFMGGVDRADENIDKYRASIRGKKWYSSPLLFCFELVLQNAWQLHKTYDEKPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 NMIKVYNQFMGGVDRADENIDKYRASIRGKKWYSSPLLFCFELVLQNAWQLHKTYDEKPV 920 930 940 950 960 970 520 530 540 550 560 570 pF1KB9 DFLEFRRRVVCHYLETHGHPPEPGQKGRPQKRNIDSRYDGINHVIVKQGKQTRCAECHKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 DFLEFRRRVVCHYLETHGHPPEPGQKGRPQKRNIDSRYDGINHVIVKQGKQTRCAECHKN 980 990 1000 1010 1020 1030 580 590 pF1KB9 TTFRCEKCDVALHVKCSVEYHTE ::::::::::::::::::::::: CCDS60 TTFRCEKCDVALHVKCSVEYHTE 1040 1050 1060 >>CCDS31128.1 PGBD2 gene_id:267002|Hs108|chr1 (592 aa) initn: 1066 init1: 963 opt: 1506 Z-score: 1616.5 bits: 309.1 E(32554): 1e-83 Smith-Waterman score: 1617; 43.2% identity (70.4% similar) in 595 aa overlap (3-591:19-590) 10 20 30 40 pF1KB9 MPRTLSLHEITDLLETDDSIEASA-IVIQPPENATAPVSDEESG .. .: :. . .: ..: . : : ::.::.. .::.:: CCDS31 MASTSRDVIAGRGIHSKVKSAKLLEVLNAMEEEESNNNREEIFIAPPDNAAGEFTDEDSG 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB9 DEEGGTINNLPGSLLHTAAYLIQDGSDAESDSDDPSYAPKDDSPDEVPSTFTVQQPPPSR ::.. .::::.:: :. : .:.. .: :.:: :: .: CCDS31 DEDSQRGAHLPGSVLH-ASVLCEDSGTGE-DNDDLEL-----------------QPAKKR 70 80 90 100 110 120 130 140 150 160 pF1KB9 RRKMTKILCKWKKADLTVQPVAGRVTAP-PN--DFFTVMRTPTEILELFLDDEVIELIVK .. ..: : : : ..: : :: :. :. . .:. ..:::.:. .:..::. CCDS31 QKAVVKPQRIWTKRD--IRPDFGSWTASDPHIEDLKSQELSPVGLFELFFDEGTINFIVN 110 120 130 140 150 170 180 190 200 210 220 pF1KB9 YSNLYACSKGVHLGLTSSEFKCFLGIIFLSGYVSVPRRRMFWEQRTDVHNVLVSAAMRRD .: :: .:.:.:.::..:.:: :::..::::.: :::::::: : :. ::. :.::: CCDS31 ETNRYAWQKNVNLSLTAQELKCVLGILILSGYISYPRRRMFWETSPDSHHHLVADAIRRD 160 170 180 190 200 210 230 240 250 260 270 280 pF1KB9 RFETIFSNLHVADNANLDPVDKFSKLRPLISKLNERCMKFVPNETYFSFDEFMVPYFGRH ::: ::: :: ::: .:: :.:.:.:::: ..: .: .: : ..:: : : :::.. CCDS31 RFELIFSYLHFADNNELDASDRFAKVRPLIIRMNCNFQKHAPLEEFYSFGESMCEYFGHR 220 230 240 250 260 270 290 300 310 320 330 340 pF1KB9 GCKQFIRGKPIRFGYKFWCGATCLGYICWFQPYQGKNPNTKHEEYGVGASLVLQFSEALT : ::. ::::.:.:::.:::.: ::. ::.: :: . . .:.:.:..: .:: CCDS31 GSKQLHRGKPVRLGYKIWCGTTSRGYLVWFEPSQGTLFTKPDRSLDLGGSMVIKFVDALQ 280 290 300 310 320 330 350 360 370 380 390 400 pF1KB9 EAHPGQYHFVFNNFFTSIALLDKLSSMGHQATGTVRKDHIDKVPLESDVALKKKERGTFD : ::. :.. :::. :.. : . : .::::::. . .. ::.. ::: .::.:: CCDS31 ERGFLPYHIFFDKVFTSVKLMSILRKKGVKATGTVREYRTERCPLKDPKELKKMKRGSFD 340 350 360 370 380 390 410 420 430 440 450 pF1KB9 YRID-GKGNIVCRWNDNSVVTVASSGAGIHPLCLVSRYSQKLKKKIQVQQPNMIKVYNQF :..: .. :::::.:.:::.. :...::.:. :.::.: : . ::.::...:.:.. CCDS31 YKVDESEEIIVCRWHDSSVVNICSNAVGIEPVRLTSRHSGAAKTRTQVHQPSLVKLYQEK 400 410 420 430 440 450 460 470 480 490 500 510 pF1KB9 MGGVDRADENIDKYRASIRGKKWYSSPLLFCFELVLQNAWQLHKTY-DEKPVDFLEFRRR .::: : :.:: ::...::: ::::: . . .. .:.::::::. .. ::.: ::: CCDS31 VGGVGRMDQNIAKYKVKIRGMKWYSSFIGYVIDAALNNAWQLHRICCQDAQVDLLAFRRY 460 470 480 490 500 510 520 530 540 550 560 570 pF1KB9 VVCHYLETHGHPPEPGQKGRPQKRNIDSRYDGINHVIVKQGKQTRCAECHKNTTFRCEKC ..: :::... :...: . . .::.: :.: :..: :.:::: ::..:. ::::: CCDS31 IACVYLESNADTTSQGRRSR--RLETESRFDMIGHWIIHQDKRTRCALCHSQTNTRCEKC 520 530 540 550 560 570 580 590 pF1KB9 DVALHVKCSVEYHTE . ..:.:: ::: CCDS31 QKGVHAKCFREYHIR 580 590 >>CCDS4648.1 PGBD1 gene_id:84547|Hs108|chr6 (809 aa) initn: 631 init1: 370 opt: 1137 Z-score: 1218.2 bits: 235.9 E(32554): 1.6e-61 Smith-Waterman score: 1138; 39.7% identity (69.6% similar) in 474 aa overlap (64-529:353-806) 40 50 60 70 80 90 pF1KB9 TAPVSDEESGDEEGGTINNLPGSLLHTAAYLIQDGSDAESDSDDPSYAPKDDSPDEVPST :.: : . .::: . ::. :. CCDS46 WARMHISSLEYAAGDITRKGRKKDKARVSELLQ-GLSFSGDSD----VEKDNEPE----- 330 340 350 360 370 100 110 120 130 140 pF1KB9 FTVQQPPPSRRRKMTKILCK-WKKADLTVQPVAGRVTAPPNDFFTVMR---TPTEILELF .: : ... :.. . : : : : ..: .: . .... .:.:..::: CCDS46 --IQ--PAQKKLKVSCFPEKSWTKRD--IKPNFPSWSALDSGLLNLKSEKLNPVELFELF 380 390 400 410 420 150 160 170 180 190 200 pF1KB9 LDDEVIELIVKYSNLYACSKGVHLGLTSSEFKCFLGIIFLSGYVSVPRRRMFWEQRTDVH .:::...:::. .: :: .:.: : .: .:..: .:...:::.. :::.:.:: .:. CCDS46 FDDETFNLIVNETNNYASQKNVSLEVTVQEMRCVFGVLLLSGFMRHPRREMYWEV-SDTD 430 440 450 460 470 480 210 220 230 240 250 260 pF1KB9 NVLVSAAMRRDRFETIFSNLHVADNANLDPVDKFSKLRPLISKLNERCMKFVPNETYFSF . :: :.:::::: :::::: :::..:: :::.::::::...:. . ..: : :. : CCDS46 QNLVRDAIRRDRFELIFSNLHFADNGHLDQKDKFTKLRPLIKQMNKNFLLYAPLEEYYCF 490 500 510 520 530 540 270 280 290 300 310 320 pF1KB9 DEFMVPYFGRHGCKQFIRGKPIRFGYKFWCGATCLGYICWFQPYQGKNPNTKHEE--YGV :. : : ::. :::::.:::.:::.: ::. ::.::: .. :. :. CCDS46 DKSMCECFD---SDQFLNGKPIRIGYKIWCGTTTQGYLVWFEPYQEESTMKVDEDPDLGL 550 560 570 580 590 600 330 340 350 360 370 380 pF1KB9 GASLVLQFSEALTEAHPGQYHFVFNNFFTSIALLDKLSSMGHQATGTVRKDHIDKVPLES :..::..:...: : ::. :..::::. ::. :.. : .::::.:... .: :: . CCDS46 GGNLVMNFADVLLERGQYPYHLCFDSFFTSVKLLSALKKKGVRATGTIRENRTEKCPLMN 610 620 630 640 650 660 390 400 410 420 430 440 pF1KB9 DVALKKKERGTFDYRIDGKGNIV-CRWNDNSVVTVASSGAGIHPLCLVSRYSQKLKKKIQ .:: .:: ::.::. ...:. ::: ...... :...::.:. :: . .. : CCDS46 VEHMKKMKRGYFDFRIEENNEIILCRWYGDGIISLCSNAVGIEPVNEVSCCDADNEEIPQ 670 680 690 700 710 720 450 460 470 480 490 500 pF1KB9 VQQPNMIKVYNQFMGGVDRADENIDKYRASIRGKKWYSSPLLFCFELVLQNAWQLHKTYD ..::...:::.. :: . :. :.:::. ::.::::: . . ......::::::.. . CCDS46 ISQPSIVKVYDECKEGVAKMDQIISKYRVRIRSKKWYSILVSYMIDVAMNNAWQLHRACN 730 740 750 760 770 780 510 520 530 540 550 560 pF1KB9 E-KPVDFLEFRRRVVCHYLETHGHPPEPGQKGRPQKRNIDSRYDGINHVIVKQGKQTRCA .: :.::: :. ::: ..: CCDS46 PGASLDPLDFRRFVAHFYLEHNAHLSD 790 800 >>CCDS31129.1 PGBD2 gene_id:267002|Hs108|chr1 (341 aa) initn: 537 init1: 537 opt: 1047 Z-score: 1127.8 bits: 217.9 E(32554): 1.7e-56 Smith-Waterman score: 1047; 44.6% identity (73.6% similar) in 341 aa overlap (253-591:1-339) 230 240 250 260 270 280 pF1KB9 ETIFSNLHVADNANLDPVDKFSKLRPLISKLNERCMKFVPNETYFSFDEFMVPYFGRHGC .: .: .: : ..:: : : :::..: CCDS31 MNCNFQKHAPLEEFYSFGESMCEYFGHRGS 10 20 30 290 300 310 320 330 340 pF1KB9 KQFIRGKPIRFGYKFWCGATCLGYICWFQPYQGKNPNTKHEEYGVGASLVLQFSEALTEA ::. ::::.:.:::.:::.: ::. ::.: :: . . .:.:.:..: .:: : CCDS31 KQLHRGKPVRLGYKIWCGTTSRGYLVWFEPSQGTLFTKPDRSLDLGGSMVIKFVDALQER 40 50 60 70 80 90 350 360 370 380 390 400 pF1KB9 HPGQYHFVFNNFFTSIALLDKLSSMGHQATGTVRKDHIDKVPLESDVALKKKERGTFDYR ::. :.. :::. :.. : . : .::::::. . .. ::.. ::: .::.:::. CCDS31 GFLPYHIFFDKVFTSVKLMSILRKKGVKATGTVREYRTERCPLKDPKELKKMKRGSFDYK 100 110 120 130 140 150 410 420 430 440 450 460 pF1KB9 ID-GKGNIVCRWNDNSVVTVASSGAGIHPLCLVSRYSQKLKKKIQVQQPNMIKVYNQFMG .: .. :::::.:.:::.. :...::.:. :.::.: : . ::.::...:.:.. .: CCDS31 VDESEEIIVCRWHDSSVVNICSNAVGIEPVRLTSRHSGAAKTRTQVHQPSLVKLYQEKVG 160 170 180 190 200 210 470 480 490 500 510 520 pF1KB9 GVDRADENIDKYRASIRGKKWYSSPLLFCFELVLQNAWQLHKTY-DEKPVDFLEFRRRVV :: : :.:: ::...::: ::::: . . .. .:.::::::. .. ::.: ::: .. CCDS31 GVGRMDQNIAKYKVKIRGMKWYSSFIGYVIDAALNNAWQLHRICCQDAQVDLLAFRRYIA 220 230 240 250 260 270 530 540 550 560 570 580 pF1KB9 CHYLETHGHPPEPGQKGRPQKRNIDSRYDGINHVIVKQGKQTRCAECHKNTTFRCEKCDV : :::... :...: . . .::.: :.: :..: :.:::: ::..:. :::::. CCDS31 CVYLESNADTTSQGRRSR--RLETESRFDMIGHWIIHQDKRTRCALCHSQTNTRCEKCQK 280 290 300 310 320 590 pF1KB9 ALHVKCSVEYHTE ..:.:: ::: CCDS31 GVHAKCFREYHIR 330 340 593 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 20:25:12 2016 done: Sat Nov 5 20:25:13 2016 Total Scan time: 3.520 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]