FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB4161, 471 aa
1>>>pF1KB4161 471 - 471 aa - 471 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 12.5962+/-0.00117; mu= -12.6671+/- 0.071
mean_var=529.0789+/-108.269, 0's: 0 Z-trim(116.3): 45 B-trim: 593 in 1/54
Lambda= 0.055759
statistics sampled from 16897 (16933) to 16897 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.787), E-opt: 0.2 (0.52), width: 16
Scan time: 3.660
The best scores are: opt bits E(32554)
CCDS44619.1 CPSF7 gene_id:79869|Hs108|chr11 ( 471) 3226 273.8 2.7e-73
CCDS8006.2 CPSF7 gene_id:79869|Hs108|chr11 ( 514) 3226 273.9 2.9e-73
CCDS44620.1 CPSF7 gene_id:79869|Hs108|chr11 ( 462) 2035 178.0 1.8e-44
CCDS8988.1 CPSF6 gene_id:11052|Hs108|chr12 ( 551) 812 79.7 8.6e-15
CCDS73494.1 CPSF6 gene_id:11052|Hs108|chr12 ( 588) 812 79.7 9e-15
>>CCDS44619.1 CPSF7 gene_id:79869|Hs108|chr11 (471 aa)
initn: 3226 init1: 3226 opt: 3226 Z-score: 1429.4 bits: 273.8 E(32554): 2.7e-73
Smith-Waterman score: 3226; 100.0% identity (100.0% similar) in 471 aa overlap (1-471:1-471)
10 20 30 40 50 60
pF1KB4 MSEGVDLIDIYADEEFNQDPEFNNTDQIDLYDDVLTATSQPSDDRSSSTEPPPPVRQEPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MSEGVDLIDIYADEEFNQDPEFNNTDQIDLYDDVLTATSQPSDDRSSSTEPPPPVRQEPS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 PKPNNKTPAILYTYSGLRNRRAAVYVGSFSWWTTDQQLIQVIRSIGVYDVVELKFAENRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PKPNNKTPAILYTYSGLRNRRAAVYVGSFSWWTTDQQLIQVIRSIGVYDVVELKFAENRA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 NGQSKGYAEVVVASENSVHKLLELLPGKVLNGEKVDVRPATRQNLSQFEAQARKRECVRV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 NGQSKGYAEVVVASENSVHKLLELLPGKVLNGEKVDVRPATRQNLSQFEAQARKRECVRV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 PRGGIPPRAHSRDSSDSADGRATPSENLVPSSARVDKPPSVLPYFNRPPSALPLMGLPPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PRGGIPPRAHSRDSSDSADGRATPSENLVPSSARVDKPPSVLPYFNRPPSALPLMGLPPP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 PIPPPPPLSSSFGVPPPPPGIHYQHLMPPPPRLPPHLAVPPPGAIPPALHLNPAFFPPPN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PIPPPPPLSSSFGVPPPPPGIHYQHLMPPPPRLPPHLAVPPPGAIPPALHLNPAFFPPPN
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 ATVGPPPDTYMKASAPYNHHGSRDSGPPPSTVSEAEFEDIMKRNRAISSSAISKAVSGAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ATVGPPPDTYMKASAPYNHHGSRDSGPPPSTVSEAEFEDIMKRNRAISSSAISKAVSGAS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 AGDYSDAIETLLTAIAVIKQSRVANDERCRVLISSLKDCLHGIEAKSYSVGASGSSSRKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 AGDYSDAIETLLTAIAVIKQSRVANDERCRVLISSLKDCLHGIEAKSYSVGASGSSSRKR
370 380 390 400 410 420
430 440 450 460 470
pF1KB4 HRSRERSPSRSRESSRRHRDLLHNEDRHDDYFQERNREHERHRDRERDRHH
:::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 HRSRERSPSRSRESSRRHRDLLHNEDRHDDYFQERNREHERHRDRERDRHH
430 440 450 460 470
>>CCDS8006.2 CPSF7 gene_id:79869|Hs108|chr11 (514 aa)
initn: 3226 init1: 3226 opt: 3226 Z-score: 1428.9 bits: 273.9 E(32554): 2.9e-73
Smith-Waterman score: 3226; 100.0% identity (100.0% similar) in 471 aa overlap (1-471:44-514)
10 20 30
pF1KB4 MSEGVDLIDIYADEEFNQDPEFNNTDQIDL
::::::::::::::::::::::::::::::
CCDS80 PFEGGGRARRAGGIFLTLSILRTRDLPSGAMSEGVDLIDIYADEEFNQDPEFNNTDQIDL
20 30 40 50 60 70
40 50 60 70 80 90
pF1KB4 YDDVLTATSQPSDDRSSSTEPPPPVRQEPSPKPNNKTPAILYTYSGLRNRRAAVYVGSFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS80 YDDVLTATSQPSDDRSSSTEPPPPVRQEPSPKPNNKTPAILYTYSGLRNRRAAVYVGSFS
80 90 100 110 120 130
100 110 120 130 140 150
pF1KB4 WWTTDQQLIQVIRSIGVYDVVELKFAENRANGQSKGYAEVVVASENSVHKLLELLPGKVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS80 WWTTDQQLIQVIRSIGVYDVVELKFAENRANGQSKGYAEVVVASENSVHKLLELLPGKVL
140 150 160 170 180 190
160 170 180 190 200 210
pF1KB4 NGEKVDVRPATRQNLSQFEAQARKRECVRVPRGGIPPRAHSRDSSDSADGRATPSENLVP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS80 NGEKVDVRPATRQNLSQFEAQARKRECVRVPRGGIPPRAHSRDSSDSADGRATPSENLVP
200 210 220 230 240 250
220 230 240 250 260 270
pF1KB4 SSARVDKPPSVLPYFNRPPSALPLMGLPPPPIPPPPPLSSSFGVPPPPPGIHYQHLMPPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS80 SSARVDKPPSVLPYFNRPPSALPLMGLPPPPIPPPPPLSSSFGVPPPPPGIHYQHLMPPP
260 270 280 290 300 310
280 290 300 310 320 330
pF1KB4 PRLPPHLAVPPPGAIPPALHLNPAFFPPPNATVGPPPDTYMKASAPYNHHGSRDSGPPPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS80 PRLPPHLAVPPPGAIPPALHLNPAFFPPPNATVGPPPDTYMKASAPYNHHGSRDSGPPPS
320 330 340 350 360 370
340 350 360 370 380 390
pF1KB4 TVSEAEFEDIMKRNRAISSSAISKAVSGASAGDYSDAIETLLTAIAVIKQSRVANDERCR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS80 TVSEAEFEDIMKRNRAISSSAISKAVSGASAGDYSDAIETLLTAIAVIKQSRVANDERCR
380 390 400 410 420 430
400 410 420 430 440 450
pF1KB4 VLISSLKDCLHGIEAKSYSVGASGSSSRKRHRSRERSPSRSRESSRRHRDLLHNEDRHDD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS80 VLISSLKDCLHGIEAKSYSVGASGSSSRKRHRSRERSPSRSRESSRRHRDLLHNEDRHDD
440 450 460 470 480 490
460 470
pF1KB4 YFQERNREHERHRDRERDRHH
:::::::::::::::::::::
CCDS80 YFQERNREHERHRDRERDRHH
500 510
>>CCDS44620.1 CPSF7 gene_id:79869|Hs108|chr11 (462 aa)
initn: 3143 init1: 2009 opt: 2035 Z-score: 911.7 bits: 178.0 E(32554): 1.8e-44
Smith-Waterman score: 3129; 98.1% identity (98.1% similar) in 471 aa overlap (1-471:1-462)
10 20 30 40 50 60
pF1KB4 MSEGVDLIDIYADEEFNQDPEFNNTDQIDLYDDVLTATSQPSDDRSSSTEPPPPVRQEPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MSEGVDLIDIYADEEFNQDPEFNNTDQIDLYDDVLTATSQPSDDRSSSTEPPPPVRQEPS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 PKPNNKTPAILYTYSGLRNRRAAVYVGSFSWWTTDQQLIQVIRSIGVYDVVELKFAENRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PKPNNKTPAILYTYSGLRNRRAAVYVGSFSWWTTDQQLIQVIRSIGVYDVVELKFAENRA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 NGQSKGYAEVVVASENSVHKLLELLPGKVLNGEKVDVRPATRQNLSQFEAQARKRECVRV
:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 NGQSKGYAEVVVASENSVHKLLELLPGKVLNGEKVDVRPATRQNLSQFEAQARKR-----
130 140 150 160 170
190 200 210 220 230 240
pF1KB4 PRGGIPPRAHSRDSSDSADGRATPSENLVPSSARVDKPPSVLPYFNRPPSALPLMGLPPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ----IPPRAHSRDSSDSADGRATPSENLVPSSARVDKPPSVLPYFNRPPSALPLMGLPPP
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB4 PIPPPPPLSSSFGVPPPPPGIHYQHLMPPPPRLPPHLAVPPPGAIPPALHLNPAFFPPPN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PIPPPPPLSSSFGVPPPPPGIHYQHLMPPPPRLPPHLAVPPPGAIPPALHLNPAFFPPPN
240 250 260 270 280 290
310 320 330 340 350 360
pF1KB4 ATVGPPPDTYMKASAPYNHHGSRDSGPPPSTVSEAEFEDIMKRNRAISSSAISKAVSGAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ATVGPPPDTYMKASAPYNHHGSRDSGPPPSTVSEAEFEDIMKRNRAISSSAISKAVSGAS
300 310 320 330 340 350
370 380 390 400 410 420
pF1KB4 AGDYSDAIETLLTAIAVIKQSRVANDERCRVLISSLKDCLHGIEAKSYSVGASGSSSRKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 AGDYSDAIETLLTAIAVIKQSRVANDERCRVLISSLKDCLHGIEAKSYSVGASGSSSRKR
360 370 380 390 400 410
430 440 450 460 470
pF1KB4 HRSRERSPSRSRESSRRHRDLLHNEDRHDDYFQERNREHERHRDRERDRHH
:::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 HRSRERSPSRSRESSRRHRDLLHNEDRHDDYFQERNREHERHRDRERDRHH
420 430 440 450 460
>>CCDS8988.1 CPSF6 gene_id:11052|Hs108|chr12 (551 aa)
initn: 871 init1: 525 opt: 812 Z-score: 379.1 bits: 79.7 E(32554): 8.6e-15
Smith-Waterman score: 1228; 45.3% identity (63.1% similar) in 510 aa overlap (43-469:48-538)
20 30 40 50 60 70
pF1KB4 DEEFNQDPEFNNTDQIDLYDDVLTATSQPSDDRSSSTEPPPPVRQEPSPKPNNKTPAILY
.::. :: : .. . .. .: ..:
CCDS89 FNQEAEYGGHDQIDLYDDVISPSANNGDAPEDRDYMDTLPPTVGDDVG---KGAAPNVVY
20 30 40 50 60 70
80 90 100 110 120 130
pF1KB4 TYSGLRNRRAAVYVGSFSWWTTDQQLIQVIRSIGVYDVVELKFAENRANGQSKGYAEVVV
::.: .: :.:.:...:::::..: ....:.:: :..:.:: ::::::::::.: : :
CCDS89 TYTG---KRIALYIGNLTWWTTDEDLTEAVHSLGVNDILEIKFFENRANGQSKGFALVGV
80 90 100 110 120 130
140 150 160 170 180
pF1KB4 ASENSVHKLLELLPGKVLNGEKVDVRPATRQNLSQFEAQARKRECVRVPRG---GIPPRA
.:: : .::..::: . :.:.. : : ..: ::::: :.:: : . :: .
CCDS89 GSEASSKKLMDLLPKRELHGQNPVVTPCNKQFLSQFEMQSRKTTQSGQMSGEGKAGPPGG
140 150 160 170 180 190
190 200 210 220 230 240
pF1KB4 HSRDS-SDSADGR-----ATPSENLVPSSARVDKPPSVLPYFNRPPSALPLMGLPPPPIP
:: . ... :: :.:. . :. : :: .: . :: : .: : :: :
CCDS89 SSRAAFPQGGRGRGRFPGAVPGGDRFPGPAGPGGPPPPFPAGQTPPR--PPLGPPGPPGP
200 210 220 230 240
250 260
pF1KB4 P---------PPPLSSS-----------------FGVPP----------------PPPGI
: ::::.. :: :: ::::
CCDS89 PGPPPPGQVLPPPLAGPPNRGDRPPPPVLFPGQPFGQPPLGPLPPGPPPPVPGYGPPPGP
250 260 270 280 290 300
270 280 290 300
pF1KB4 HYQHLMPPPP----------------RL--PPHLAVPPPGAIPPALHLNPAFFPPPNAT-
. :::: : :::: ::::: ::: :.::::::::. .
CCDS89 PPPQQGPPPPPGPFPPRPPGPLGPPLTLAPPPHLPGPPPGAPPPAPHVNPAFFPPPTNSG
310 320 330 340 350 360
310 320 330 340
pF1KB4 ------VGPPPDTYMKASAPYNHHGSRDSGPPP-------STVSEAEFEDIMKRNRAISS
:::: . ::.. : : ::: . .::::::.::.:::::::
CCDS89 MPTSDSRGPPPTDPYGRPPPYDR-G--DYGPPGREMDTARTPLSEAEFEEIMNRNRAISS
370 380 390 400 410 420
350 360 370 380 390 400
pF1KB4 SAISKAVSGASAGDYSDAIETLLTAIAVIKQSRVANDERCRVLISSLKDCLHGIEAKSYS
::::.::: ::::::..:::::.:::..::::.:. :.::.::::::.:::::::.:::
CCDS89 SAISRAVSDASAGDYGSAIETLVTAISLIKQSKVSADDRCKVLISSLQDCLHGIESKSY-
430 440 450 460 470 480
410 420 430 440 450 460
pF1KB4 VGASGSSSRKRHRSRERSPSRSRESSRRHRDLLHNEDRHDDYFQERNREHERHRDRERDR
::.:: :.:::::. :::::.::::.. ...::::::..::.::.::::::.:::
CCDS89 ----GSGSR-RERSRERDHSRSREKSRRHKS--RSRDRHDDYYRERSRERERHRDRDRDR
490 500 510 520 530
470
pF1KB4 HH
CCDS89 DRERDREREYRHR
540 550
>>CCDS73494.1 CPSF6 gene_id:11052|Hs108|chr12 (588 aa)
initn: 1094 init1: 525 opt: 812 Z-score: 378.7 bits: 79.7 E(32554): 9e-15
Smith-Waterman score: 1103; 44.2% identity (60.6% similar) in 505 aa overlap (84-469:83-575)
60 70 80 90 100 110
pF1KB4 PVRQEPSPKPNNKTPAILYTYSGLRNRRAAVYVGSFSWWTTDQQLIQVIRSIGVYDVVEL
.:.:...:::::..: ....:.:: :..:.
CCDS73 MDTLPPTVGDDVGKGAAPNVVYTYTGKRIALYIGNLTWWTTDEDLTEAVHSLGVNDILEI
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB4 KFAENRANGQSKGYAEVVVASENSVHKLLELLPGKVLNGEKVDVRPATRQNLSQFEAQAR
:: ::::::::::.: : :.:: : .::..::: . :.:.. : : ..: ::::: :.:
CCDS73 KFFENRANGQSKGFALVGVGSEASSKKLMDLLPKRELHGQNPVVTPCNKQFLSQFEMQSR
120 130 140 150 160 170
180 190 200 210 220
pF1KB4 KRECVRVPRG---GIPPRAHSRDS-SDSADGR-----ATPSENLVPSSARVDKPPSVLP-
: : . :: . :: . ... :: :.:. . :. : :: .:
CCDS73 KTTQSGQMSGEGKAGPPGGSSRAAFPQGGRGRGRFPGAVPGGDRFPGPAGPGGPPPPFPG
180 190 200 210 220 230
230 240
pF1KB4 -------YFNRP-------P-------SALPLMGL---------------------PPPP
.:: : .:..:: ::::
CCDS73 NLIKHLVKGTRPLFLETRIPWHMGHSIEEIPIFGLKAGQTPPRPPLGPPGPPGPPGPPPP
240 250 260 270 280 290
250 260
pF1KB4 ---IPPP------------PPL---SSSFGVPP----------------PPPGIHYQHLM
.::: ::. .. :: :: :::: .
CCDS73 GQVLPPPLAGPPNRGDRPPPPVLFPGQPFGQPPLGPLPPGPPPPVPGYGPPPGPPPPQQG
300 310 320 330 340 350
270 280 290 300
pF1KB4 PPPP----------------RL--PPHLAVPPPGAIPPALHLNPAFFPPPNAT-------
:::: : :::: ::::: ::: :.::::::::. .
CCDS73 PPPPPGPFPPRPPGPLGPPLTLAPPPHLPGPPPGAPPPAPHVNPAFFPPPTNSGMPTSDS
360 370 380 390 400 410
310 320 330 340 350
pF1KB4 VGPPP-DTYMKASAPYNHHGSRDSGPPP-------STVSEAEFEDIMKRNRAISSSAISK
:::: : : . ::.. : : ::: . .::::::.::.:::::::::::.
CCDS73 RGPPPTDPYGRPP-PYDR-G--DYGPPGREMDTARTPLSEAEFEEIMNRNRAISSSAISR
420 430 440 450 460
360 370 380 390 400 410
pF1KB4 AVSGASAGDYSDAIETLLTAIAVIKQSRVANDERCRVLISSLKDCLHGIEAKSYSVGASG
::: ::::::..:::::.:::..::::.:. :.::.::::::.:::::::.::: :
CCDS73 AVSDASAGDYGSAIETLVTAISLIKQSKVSADDRCKVLISSLQDCLHGIESKSY-----G
470 480 490 500 510 520
420 430 440 450 460 470
pF1KB4 SSSRKRHRSRERSPSRSRESSRRHRDLLHNEDRHDDYFQERNREHERHRDRERDRHH
:.:: :.:::::. :::::.::::.. ...::::::..::.::.::::::.:::
CCDS73 SGSR-RERSRERDHSRSREKSRRHKS--RSRDRHDDYYRERSRERERHRDRDRDRDRERD
530 540 550 560 570 580
CCDS73 REREYRHR
471 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 05:40:34 2016 done: Sat Nov 5 05:40:34 2016
Total Scan time: 3.660 Total Display time: 0.040
Function used was FASTA [36.3.4 Apr, 2011]