FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB9592, 593 aa
1>>>pF1KB9592 593 - 593 aa - 593 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.6536+/-0.000819; mu= 12.3759+/- 0.049
mean_var=86.7932+/-17.447, 0's: 0 Z-trim(108.8): 14 B-trim: 0 in 0/52
Lambda= 0.137667
statistics sampled from 10410 (10421) to 10410 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.682), E-opt: 0.2 (0.32), width: 16
Scan time: 3.520
The best scores are: opt bits E(32554)
CCDS7230.1 PGBD3 gene_id:267004|Hs108|chr10 ( 593) 4078 819.9 0
CCDS60529.1 ERCC6 gene_id:2074|Hs108|chr10 (1061) 4078 820.0 0
CCDS31128.1 PGBD2 gene_id:267002|Hs108|chr1 ( 592) 1506 309.1 1e-83
CCDS4648.1 PGBD1 gene_id:84547|Hs108|chr6 ( 809) 1137 235.9 1.6e-61
CCDS31129.1 PGBD2 gene_id:267002|Hs108|chr1 ( 341) 1047 217.9 1.7e-56
>>CCDS7230.1 PGBD3 gene_id:267004|Hs108|chr10 (593 aa)
initn: 4078 init1: 4078 opt: 4078 Z-score: 4377.3 bits: 819.9 E(32554): 0
Smith-Waterman score: 4078; 99.8% identity (100.0% similar) in 593 aa overlap (1-593:1-593)
10 20 30 40 50 60
pF1KB9 MPRTLSLHEITDLLETDDSIEASAIVIQPPENATAPVSDEESGDEEGGTINNLPGSLLHT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 MPRTLSLHEITDLLETDDSIEASAIVIQPPENATAPVSDEESGDEEGGTINNLPGSLLHT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 AAYLIQDGSDAESDSDDPSYAPKDDSPDEVPSTFTVQQPPPSRRRKMTKILCKWKKADLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 AAYLIQDGSDAESDSDDPSYAPKDDSPDEVPSTFTVQQPPPSRRRKMTKILCKWKKADLT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 VQPVAGRVTAPPNDFFTVMRTPTEILELFLDDEVIELIVKYSNLYACSKGVHLGLTSSEF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 VQPVAGRVTAPPNDFFTVMRTPTEILELFLDDEVIELIVKYSNLYACSKGVHLGLTSSEF
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 KCFLGIIFLSGYVSVPRRRMFWEQRTDVHNVLVSAAMRRDRFETIFSNLHVADNANLDPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 KCFLGIIFLSGYVSVPRRRMFWEQRTDVHNVLVSAAMRRDRFETIFSNLHVADNANLDPV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 DKFSKLRPLISKLNERCMKFVPNETYFSFDEFMVPYFGRHGCKQFIRGKPIRFGYKFWCG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 DKFSKLRPLISKLNERCMKFVPNETYFSFDEFMVPYFGRHGCKQFIRGKPIRFGYKFWCG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB9 ATCLGYICWFQPYQGKNPNTKHEEYGVGASLVLQFSEALTEAHPGQYHFVFNNFFTSIAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 ATCLGYICWFQPYQGKNPNTKHEEYGVGASLVLQFSEALTEAHPGQYHFVFNNFFTSIAL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB9 LDKLSSMGHQATGTVRKDHIDKVPLESDVALKKKERGTFDYRIDGKGNIVCRWNDNSVVT
:::::::::::::::::::::.::::::::::::::::::::::::::::::::::::::
CCDS72 LDKLSSMGHQATGTVRKDHIDRVPLESDVALKKKERGTFDYRIDGKGNIVCRWNDNSVVT
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB9 VASSGAGIHPLCLVSRYSQKLKKKIQVQQPNMIKVYNQFMGGVDRADENIDKYRASIRGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 VASSGAGIHPLCLVSRYSQKLKKKIQVQQPNMIKVYNQFMGGVDRADENIDKYRASIRGK
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB9 KWYSSPLLFCFELVLQNAWQLHKTYDEKPVDFLEFRRRVVCHYLETHGHPPEPGQKGRPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 KWYSSPLLFCFELVLQNAWQLHKTYDEKPVDFLEFRRRVVCHYLETHGHPPEPGQKGRPQ
490 500 510 520 530 540
550 560 570 580 590
pF1KB9 KRNIDSRYDGINHVIVKQGKQTRCAECHKNTTFRCEKCDVALHVKCSVEYHTE
:::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS72 KRNIDSRYDGINHVIVKQGKQTRCAECHKNTTFRCEKCDVALHVKCSVEYHTE
550 560 570 580 590
>>CCDS60529.1 ERCC6 gene_id:2074|Hs108|chr10 (1061 aa)
initn: 4078 init1: 4078 opt: 4078 Z-score: 4373.1 bits: 820.0 E(32554): 0
Smith-Waterman score: 4078; 99.8% identity (100.0% similar) in 593 aa overlap (1-593:469-1061)
10 20 30
pF1KB9 MPRTLSLHEITDLLETDDSIEASAIVIQPP
::::::::::::::::::::::::::::::
CCDS60 VGEGGGGGRKVGRYRDDGDEDYYKQRLSPKMPRTLSLHEITDLLETDDSIEASAIVIQPP
440 450 460 470 480 490
40 50 60 70 80 90
pF1KB9 ENATAPVSDEESGDEEGGTINNLPGSLLHTAAYLIQDGSDAESDSDDPSYAPKDDSPDEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 ENATAPVSDEESGDEEGGTINNLPGSLLHTAAYLIQDGSDAESDSDDPSYAPKDDSPDEV
500 510 520 530 540 550
100 110 120 130 140 150
pF1KB9 PSTFTVQQPPPSRRRKMTKILCKWKKADLTVQPVAGRVTAPPNDFFTVMRTPTEILELFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 PSTFTVQQPPPSRRRKMTKILCKWKKADLTVQPVAGRVTAPPNDFFTVMRTPTEILELFL
560 570 580 590 600 610
160 170 180 190 200 210
pF1KB9 DDEVIELIVKYSNLYACSKGVHLGLTSSEFKCFLGIIFLSGYVSVPRRRMFWEQRTDVHN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 DDEVIELIVKYSNLYACSKGVHLGLTSSEFKCFLGIIFLSGYVSVPRRRMFWEQRTDVHN
620 630 640 650 660 670
220 230 240 250 260 270
pF1KB9 VLVSAAMRRDRFETIFSNLHVADNANLDPVDKFSKLRPLISKLNERCMKFVPNETYFSFD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 VLVSAAMRRDRFETIFSNLHVADNANLDPVDKFSKLRPLISKLNERCMKFVPNETYFSFD
680 690 700 710 720 730
280 290 300 310 320 330
pF1KB9 EFMVPYFGRHGCKQFIRGKPIRFGYKFWCGATCLGYICWFQPYQGKNPNTKHEEYGVGAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 EFMVPYFGRHGCKQFIRGKPIRFGYKFWCGATCLGYICWFQPYQGKNPNTKHEEYGVGAS
740 750 760 770 780 790
340 350 360 370 380 390
pF1KB9 LVLQFSEALTEAHPGQYHFVFNNFFTSIALLDKLSSMGHQATGTVRKDHIDKVPLESDVA
:::::::::::::::::::::::::::::::::::::::::::::::::::.::::::::
CCDS60 LVLQFSEALTEAHPGQYHFVFNNFFTSIALLDKLSSMGHQATGTVRKDHIDRVPLESDVA
800 810 820 830 840 850
400 410 420 430 440 450
pF1KB9 LKKKERGTFDYRIDGKGNIVCRWNDNSVVTVASSGAGIHPLCLVSRYSQKLKKKIQVQQP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 LKKKERGTFDYRIDGKGNIVCRWNDNSVVTVASSGAGIHPLCLVSRYSQKLKKKIQVQQP
860 870 880 890 900 910
460 470 480 490 500 510
pF1KB9 NMIKVYNQFMGGVDRADENIDKYRASIRGKKWYSSPLLFCFELVLQNAWQLHKTYDEKPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 NMIKVYNQFMGGVDRADENIDKYRASIRGKKWYSSPLLFCFELVLQNAWQLHKTYDEKPV
920 930 940 950 960 970
520 530 540 550 560 570
pF1KB9 DFLEFRRRVVCHYLETHGHPPEPGQKGRPQKRNIDSRYDGINHVIVKQGKQTRCAECHKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 DFLEFRRRVVCHYLETHGHPPEPGQKGRPQKRNIDSRYDGINHVIVKQGKQTRCAECHKN
980 990 1000 1010 1020 1030
580 590
pF1KB9 TTFRCEKCDVALHVKCSVEYHTE
:::::::::::::::::::::::
CCDS60 TTFRCEKCDVALHVKCSVEYHTE
1040 1050 1060
>>CCDS31128.1 PGBD2 gene_id:267002|Hs108|chr1 (592 aa)
initn: 1066 init1: 963 opt: 1506 Z-score: 1616.5 bits: 309.1 E(32554): 1e-83
Smith-Waterman score: 1617; 43.2% identity (70.4% similar) in 595 aa overlap (3-591:19-590)
10 20 30 40
pF1KB9 MPRTLSLHEITDLLETDDSIEASA-IVIQPPENATAPVSDEESG
.. .: :. . .: ..: . : : ::.::.. .::.::
CCDS31 MASTSRDVIAGRGIHSKVKSAKLLEVLNAMEEEESNNNREEIFIAPPDNAAGEFTDEDSG
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB9 DEEGGTINNLPGSLLHTAAYLIQDGSDAESDSDDPSYAPKDDSPDEVPSTFTVQQPPPSR
::.. .::::.:: :. : .:.. .: :.:: :: .:
CCDS31 DEDSQRGAHLPGSVLH-ASVLCEDSGTGE-DNDDLEL-----------------QPAKKR
70 80 90 100
110 120 130 140 150 160
pF1KB9 RRKMTKILCKWKKADLTVQPVAGRVTAP-PN--DFFTVMRTPTEILELFLDDEVIELIVK
.. ..: : : : ..: : :: :. :. . .:. ..:::.:. .:..::.
CCDS31 QKAVVKPQRIWTKRD--IRPDFGSWTASDPHIEDLKSQELSPVGLFELFFDEGTINFIVN
110 120 130 140 150
170 180 190 200 210 220
pF1KB9 YSNLYACSKGVHLGLTSSEFKCFLGIIFLSGYVSVPRRRMFWEQRTDVHNVLVSAAMRRD
.: :: .:.:.:.::..:.:: :::..::::.: :::::::: : :. ::. :.:::
CCDS31 ETNRYAWQKNVNLSLTAQELKCVLGILILSGYISYPRRRMFWETSPDSHHHLVADAIRRD
160 170 180 190 200 210
230 240 250 260 270 280
pF1KB9 RFETIFSNLHVADNANLDPVDKFSKLRPLISKLNERCMKFVPNETYFSFDEFMVPYFGRH
::: ::: :: ::: .:: :.:.:.:::: ..: .: .: : ..:: : : :::..
CCDS31 RFELIFSYLHFADNNELDASDRFAKVRPLIIRMNCNFQKHAPLEEFYSFGESMCEYFGHR
220 230 240 250 260 270
290 300 310 320 330 340
pF1KB9 GCKQFIRGKPIRFGYKFWCGATCLGYICWFQPYQGKNPNTKHEEYGVGASLVLQFSEALT
: ::. ::::.:.:::.:::.: ::. ::.: :: . . .:.:.:..: .::
CCDS31 GSKQLHRGKPVRLGYKIWCGTTSRGYLVWFEPSQGTLFTKPDRSLDLGGSMVIKFVDALQ
280 290 300 310 320 330
350 360 370 380 390 400
pF1KB9 EAHPGQYHFVFNNFFTSIALLDKLSSMGHQATGTVRKDHIDKVPLESDVALKKKERGTFD
: ::. :.. :::. :.. : . : .::::::. . .. ::.. ::: .::.::
CCDS31 ERGFLPYHIFFDKVFTSVKLMSILRKKGVKATGTVREYRTERCPLKDPKELKKMKRGSFD
340 350 360 370 380 390
410 420 430 440 450
pF1KB9 YRID-GKGNIVCRWNDNSVVTVASSGAGIHPLCLVSRYSQKLKKKIQVQQPNMIKVYNQF
:..: .. :::::.:.:::.. :...::.:. :.::.: : . ::.::...:.:..
CCDS31 YKVDESEEIIVCRWHDSSVVNICSNAVGIEPVRLTSRHSGAAKTRTQVHQPSLVKLYQEK
400 410 420 430 440 450
460 470 480 490 500 510
pF1KB9 MGGVDRADENIDKYRASIRGKKWYSSPLLFCFELVLQNAWQLHKTY-DEKPVDFLEFRRR
.::: : :.:: ::...::: ::::: . . .. .:.::::::. .. ::.: :::
CCDS31 VGGVGRMDQNIAKYKVKIRGMKWYSSFIGYVIDAALNNAWQLHRICCQDAQVDLLAFRRY
460 470 480 490 500 510
520 530 540 550 560 570
pF1KB9 VVCHYLETHGHPPEPGQKGRPQKRNIDSRYDGINHVIVKQGKQTRCAECHKNTTFRCEKC
..: :::... :...: . . .::.: :.: :..: :.:::: ::..:. :::::
CCDS31 IACVYLESNADTTSQGRRSR--RLETESRFDMIGHWIIHQDKRTRCALCHSQTNTRCEKC
520 530 540 550 560 570
580 590
pF1KB9 DVALHVKCSVEYHTE
. ..:.:: :::
CCDS31 QKGVHAKCFREYHIR
580 590
>>CCDS4648.1 PGBD1 gene_id:84547|Hs108|chr6 (809 aa)
initn: 631 init1: 370 opt: 1137 Z-score: 1218.2 bits: 235.9 E(32554): 1.6e-61
Smith-Waterman score: 1138; 39.7% identity (69.6% similar) in 474 aa overlap (64-529:353-806)
40 50 60 70 80 90
pF1KB9 TAPVSDEESGDEEGGTINNLPGSLLHTAAYLIQDGSDAESDSDDPSYAPKDDSPDEVPST
:.: : . .::: . ::. :.
CCDS46 WARMHISSLEYAAGDITRKGRKKDKARVSELLQ-GLSFSGDSD----VEKDNEPE-----
330 340 350 360 370
100 110 120 130 140
pF1KB9 FTVQQPPPSRRRKMTKILCK-WKKADLTVQPVAGRVTAPPNDFFTVMR---TPTEILELF
.: : ... :.. . : : : : ..: .: . .... .:.:..:::
CCDS46 --IQ--PAQKKLKVSCFPEKSWTKRD--IKPNFPSWSALDSGLLNLKSEKLNPVELFELF
380 390 400 410 420
150 160 170 180 190 200
pF1KB9 LDDEVIELIVKYSNLYACSKGVHLGLTSSEFKCFLGIIFLSGYVSVPRRRMFWEQRTDVH
.:::...:::. .: :: .:.: : .: .:..: .:...:::.. :::.:.:: .:.
CCDS46 FDDETFNLIVNETNNYASQKNVSLEVTVQEMRCVFGVLLLSGFMRHPRREMYWEV-SDTD
430 440 450 460 470 480
210 220 230 240 250 260
pF1KB9 NVLVSAAMRRDRFETIFSNLHVADNANLDPVDKFSKLRPLISKLNERCMKFVPNETYFSF
. :: :.:::::: :::::: :::..:: :::.::::::...:. . ..: : :. :
CCDS46 QNLVRDAIRRDRFELIFSNLHFADNGHLDQKDKFTKLRPLIKQMNKNFLLYAPLEEYYCF
490 500 510 520 530 540
270 280 290 300 310 320
pF1KB9 DEFMVPYFGRHGCKQFIRGKPIRFGYKFWCGATCLGYICWFQPYQGKNPNTKHEE--YGV
:. : : ::. :::::.:::.:::.: ::. ::.::: .. :. :.
CCDS46 DKSMCECFD---SDQFLNGKPIRIGYKIWCGTTTQGYLVWFEPYQEESTMKVDEDPDLGL
550 560 570 580 590 600
330 340 350 360 370 380
pF1KB9 GASLVLQFSEALTEAHPGQYHFVFNNFFTSIALLDKLSSMGHQATGTVRKDHIDKVPLES
:..::..:...: : ::. :..::::. ::. :.. : .::::.:... .: :: .
CCDS46 GGNLVMNFADVLLERGQYPYHLCFDSFFTSVKLLSALKKKGVRATGTIRENRTEKCPLMN
610 620 630 640 650 660
390 400 410 420 430 440
pF1KB9 DVALKKKERGTFDYRIDGKGNIV-CRWNDNSVVTVASSGAGIHPLCLVSRYSQKLKKKIQ
.:: .:: ::.::. ...:. ::: ...... :...::.:. :: . .. :
CCDS46 VEHMKKMKRGYFDFRIEENNEIILCRWYGDGIISLCSNAVGIEPVNEVSCCDADNEEIPQ
670 680 690 700 710 720
450 460 470 480 490 500
pF1KB9 VQQPNMIKVYNQFMGGVDRADENIDKYRASIRGKKWYSSPLLFCFELVLQNAWQLHKTYD
..::...:::.. :: . :. :.:::. ::.::::: . . ......::::::.. .
CCDS46 ISQPSIVKVYDECKEGVAKMDQIISKYRVRIRSKKWYSILVSYMIDVAMNNAWQLHRACN
730 740 750 760 770 780
510 520 530 540 550 560
pF1KB9 E-KPVDFLEFRRRVVCHYLETHGHPPEPGQKGRPQKRNIDSRYDGINHVIVKQGKQTRCA
.: :.::: :. ::: ..:
CCDS46 PGASLDPLDFRRFVAHFYLEHNAHLSD
790 800
>>CCDS31129.1 PGBD2 gene_id:267002|Hs108|chr1 (341 aa)
initn: 537 init1: 537 opt: 1047 Z-score: 1127.8 bits: 217.9 E(32554): 1.7e-56
Smith-Waterman score: 1047; 44.6% identity (73.6% similar) in 341 aa overlap (253-591:1-339)
230 240 250 260 270 280
pF1KB9 ETIFSNLHVADNANLDPVDKFSKLRPLISKLNERCMKFVPNETYFSFDEFMVPYFGRHGC
.: .: .: : ..:: : : :::..:
CCDS31 MNCNFQKHAPLEEFYSFGESMCEYFGHRGS
10 20 30
290 300 310 320 330 340
pF1KB9 KQFIRGKPIRFGYKFWCGATCLGYICWFQPYQGKNPNTKHEEYGVGASLVLQFSEALTEA
::. ::::.:.:::.:::.: ::. ::.: :: . . .:.:.:..: .:: :
CCDS31 KQLHRGKPVRLGYKIWCGTTSRGYLVWFEPSQGTLFTKPDRSLDLGGSMVIKFVDALQER
40 50 60 70 80 90
350 360 370 380 390 400
pF1KB9 HPGQYHFVFNNFFTSIALLDKLSSMGHQATGTVRKDHIDKVPLESDVALKKKERGTFDYR
::. :.. :::. :.. : . : .::::::. . .. ::.. ::: .::.:::.
CCDS31 GFLPYHIFFDKVFTSVKLMSILRKKGVKATGTVREYRTERCPLKDPKELKKMKRGSFDYK
100 110 120 130 140 150
410 420 430 440 450 460
pF1KB9 ID-GKGNIVCRWNDNSVVTVASSGAGIHPLCLVSRYSQKLKKKIQVQQPNMIKVYNQFMG
.: .. :::::.:.:::.. :...::.:. :.::.: : . ::.::...:.:.. .:
CCDS31 VDESEEIIVCRWHDSSVVNICSNAVGIEPVRLTSRHSGAAKTRTQVHQPSLVKLYQEKVG
160 170 180 190 200 210
470 480 490 500 510 520
pF1KB9 GVDRADENIDKYRASIRGKKWYSSPLLFCFELVLQNAWQLHKTY-DEKPVDFLEFRRRVV
:: : :.:: ::...::: ::::: . . .. .:.::::::. .. ::.: ::: ..
CCDS31 GVGRMDQNIAKYKVKIRGMKWYSSFIGYVIDAALNNAWQLHRICCQDAQVDLLAFRRYIA
220 230 240 250 260 270
530 540 550 560 570 580
pF1KB9 CHYLETHGHPPEPGQKGRPQKRNIDSRYDGINHVIVKQGKQTRCAECHKNTTFRCEKCDV
: :::... :...: . . .::.: :.: :..: :.:::: ::..:. :::::.
CCDS31 CVYLESNADTTSQGRRSR--RLETESRFDMIGHWIIHQDKRTRCALCHSQTNTRCEKCQK
280 290 300 310 320
590
pF1KB9 ALHVKCSVEYHTE
..:.:: :::
CCDS31 GVHAKCFREYHIR
330 340
593 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 20:25:12 2016 done: Sat Nov 5 20:25:13 2016
Total Scan time: 3.520 Total Display time: 0.070
Function used was FASTA [36.3.4 Apr, 2011]