FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB4161, 471 aa 1>>>pF1KB4161 471 - 471 aa - 471 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 12.5962+/-0.00117; mu= -12.6671+/- 0.071 mean_var=529.0789+/-108.269, 0's: 0 Z-trim(116.3): 45 B-trim: 593 in 1/54 Lambda= 0.055759 statistics sampled from 16897 (16933) to 16897 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.787), E-opt: 0.2 (0.52), width: 16 Scan time: 3.660 The best scores are: opt bits E(32554) CCDS44619.1 CPSF7 gene_id:79869|Hs108|chr11 ( 471) 3226 273.8 2.7e-73 CCDS8006.2 CPSF7 gene_id:79869|Hs108|chr11 ( 514) 3226 273.9 2.9e-73 CCDS44620.1 CPSF7 gene_id:79869|Hs108|chr11 ( 462) 2035 178.0 1.8e-44 CCDS8988.1 CPSF6 gene_id:11052|Hs108|chr12 ( 551) 812 79.7 8.6e-15 CCDS73494.1 CPSF6 gene_id:11052|Hs108|chr12 ( 588) 812 79.7 9e-15 >>CCDS44619.1 CPSF7 gene_id:79869|Hs108|chr11 (471 aa) initn: 3226 init1: 3226 opt: 3226 Z-score: 1429.4 bits: 273.8 E(32554): 2.7e-73 Smith-Waterman score: 3226; 100.0% identity (100.0% similar) in 471 aa overlap (1-471:1-471) 10 20 30 40 50 60 pF1KB4 MSEGVDLIDIYADEEFNQDPEFNNTDQIDLYDDVLTATSQPSDDRSSSTEPPPPVRQEPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MSEGVDLIDIYADEEFNQDPEFNNTDQIDLYDDVLTATSQPSDDRSSSTEPPPPVRQEPS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 PKPNNKTPAILYTYSGLRNRRAAVYVGSFSWWTTDQQLIQVIRSIGVYDVVELKFAENRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 PKPNNKTPAILYTYSGLRNRRAAVYVGSFSWWTTDQQLIQVIRSIGVYDVVELKFAENRA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 NGQSKGYAEVVVASENSVHKLLELLPGKVLNGEKVDVRPATRQNLSQFEAQARKRECVRV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 NGQSKGYAEVVVASENSVHKLLELLPGKVLNGEKVDVRPATRQNLSQFEAQARKRECVRV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB4 PRGGIPPRAHSRDSSDSADGRATPSENLVPSSARVDKPPSVLPYFNRPPSALPLMGLPPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 PRGGIPPRAHSRDSSDSADGRATPSENLVPSSARVDKPPSVLPYFNRPPSALPLMGLPPP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB4 PIPPPPPLSSSFGVPPPPPGIHYQHLMPPPPRLPPHLAVPPPGAIPPALHLNPAFFPPPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 PIPPPPPLSSSFGVPPPPPGIHYQHLMPPPPRLPPHLAVPPPGAIPPALHLNPAFFPPPN 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB4 ATVGPPPDTYMKASAPYNHHGSRDSGPPPSTVSEAEFEDIMKRNRAISSSAISKAVSGAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 ATVGPPPDTYMKASAPYNHHGSRDSGPPPSTVSEAEFEDIMKRNRAISSSAISKAVSGAS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB4 AGDYSDAIETLLTAIAVIKQSRVANDERCRVLISSLKDCLHGIEAKSYSVGASGSSSRKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 AGDYSDAIETLLTAIAVIKQSRVANDERCRVLISSLKDCLHGIEAKSYSVGASGSSSRKR 370 380 390 400 410 420 430 440 450 460 470 pF1KB4 HRSRERSPSRSRESSRRHRDLLHNEDRHDDYFQERNREHERHRDRERDRHH ::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 HRSRERSPSRSRESSRRHRDLLHNEDRHDDYFQERNREHERHRDRERDRHH 430 440 450 460 470 >>CCDS8006.2 CPSF7 gene_id:79869|Hs108|chr11 (514 aa) initn: 3226 init1: 3226 opt: 3226 Z-score: 1428.9 bits: 273.9 E(32554): 2.9e-73 Smith-Waterman score: 3226; 100.0% identity (100.0% similar) in 471 aa overlap (1-471:44-514) 10 20 30 pF1KB4 MSEGVDLIDIYADEEFNQDPEFNNTDQIDL :::::::::::::::::::::::::::::: CCDS80 PFEGGGRARRAGGIFLTLSILRTRDLPSGAMSEGVDLIDIYADEEFNQDPEFNNTDQIDL 20 30 40 50 60 70 40 50 60 70 80 90 pF1KB4 YDDVLTATSQPSDDRSSSTEPPPPVRQEPSPKPNNKTPAILYTYSGLRNRRAAVYVGSFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS80 YDDVLTATSQPSDDRSSSTEPPPPVRQEPSPKPNNKTPAILYTYSGLRNRRAAVYVGSFS 80 90 100 110 120 130 100 110 120 130 140 150 pF1KB4 WWTTDQQLIQVIRSIGVYDVVELKFAENRANGQSKGYAEVVVASENSVHKLLELLPGKVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS80 WWTTDQQLIQVIRSIGVYDVVELKFAENRANGQSKGYAEVVVASENSVHKLLELLPGKVL 140 150 160 170 180 190 160 170 180 190 200 210 pF1KB4 NGEKVDVRPATRQNLSQFEAQARKRECVRVPRGGIPPRAHSRDSSDSADGRATPSENLVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS80 NGEKVDVRPATRQNLSQFEAQARKRECVRVPRGGIPPRAHSRDSSDSADGRATPSENLVP 200 210 220 230 240 250 220 230 240 250 260 270 pF1KB4 SSARVDKPPSVLPYFNRPPSALPLMGLPPPPIPPPPPLSSSFGVPPPPPGIHYQHLMPPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS80 SSARVDKPPSVLPYFNRPPSALPLMGLPPPPIPPPPPLSSSFGVPPPPPGIHYQHLMPPP 260 270 280 290 300 310 280 290 300 310 320 330 pF1KB4 PRLPPHLAVPPPGAIPPALHLNPAFFPPPNATVGPPPDTYMKASAPYNHHGSRDSGPPPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS80 PRLPPHLAVPPPGAIPPALHLNPAFFPPPNATVGPPPDTYMKASAPYNHHGSRDSGPPPS 320 330 340 350 360 370 340 350 360 370 380 390 pF1KB4 TVSEAEFEDIMKRNRAISSSAISKAVSGASAGDYSDAIETLLTAIAVIKQSRVANDERCR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS80 TVSEAEFEDIMKRNRAISSSAISKAVSGASAGDYSDAIETLLTAIAVIKQSRVANDERCR 380 390 400 410 420 430 400 410 420 430 440 450 pF1KB4 VLISSLKDCLHGIEAKSYSVGASGSSSRKRHRSRERSPSRSRESSRRHRDLLHNEDRHDD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS80 VLISSLKDCLHGIEAKSYSVGASGSSSRKRHRSRERSPSRSRESSRRHRDLLHNEDRHDD 440 450 460 470 480 490 460 470 pF1KB4 YFQERNREHERHRDRERDRHH ::::::::::::::::::::: CCDS80 YFQERNREHERHRDRERDRHH 500 510 >>CCDS44620.1 CPSF7 gene_id:79869|Hs108|chr11 (462 aa) initn: 3143 init1: 2009 opt: 2035 Z-score: 911.7 bits: 178.0 E(32554): 1.8e-44 Smith-Waterman score: 3129; 98.1% identity (98.1% similar) in 471 aa overlap (1-471:1-462) 10 20 30 40 50 60 pF1KB4 MSEGVDLIDIYADEEFNQDPEFNNTDQIDLYDDVLTATSQPSDDRSSSTEPPPPVRQEPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MSEGVDLIDIYADEEFNQDPEFNNTDQIDLYDDVLTATSQPSDDRSSSTEPPPPVRQEPS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 PKPNNKTPAILYTYSGLRNRRAAVYVGSFSWWTTDQQLIQVIRSIGVYDVVELKFAENRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 PKPNNKTPAILYTYSGLRNRRAAVYVGSFSWWTTDQQLIQVIRSIGVYDVVELKFAENRA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 NGQSKGYAEVVVASENSVHKLLELLPGKVLNGEKVDVRPATRQNLSQFEAQARKRECVRV ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 NGQSKGYAEVVVASENSVHKLLELLPGKVLNGEKVDVRPATRQNLSQFEAQARKR----- 130 140 150 160 170 190 200 210 220 230 240 pF1KB4 PRGGIPPRAHSRDSSDSADGRATPSENLVPSSARVDKPPSVLPYFNRPPSALPLMGLPPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 ----IPPRAHSRDSSDSADGRATPSENLVPSSARVDKPPSVLPYFNRPPSALPLMGLPPP 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB4 PIPPPPPLSSSFGVPPPPPGIHYQHLMPPPPRLPPHLAVPPPGAIPPALHLNPAFFPPPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 PIPPPPPLSSSFGVPPPPPGIHYQHLMPPPPRLPPHLAVPPPGAIPPALHLNPAFFPPPN 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB4 ATVGPPPDTYMKASAPYNHHGSRDSGPPPSTVSEAEFEDIMKRNRAISSSAISKAVSGAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 ATVGPPPDTYMKASAPYNHHGSRDSGPPPSTVSEAEFEDIMKRNRAISSSAISKAVSGAS 300 310 320 330 340 350 370 380 390 400 410 420 pF1KB4 AGDYSDAIETLLTAIAVIKQSRVANDERCRVLISSLKDCLHGIEAKSYSVGASGSSSRKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 AGDYSDAIETLLTAIAVIKQSRVANDERCRVLISSLKDCLHGIEAKSYSVGASGSSSRKR 360 370 380 390 400 410 430 440 450 460 470 pF1KB4 HRSRERSPSRSRESSRRHRDLLHNEDRHDDYFQERNREHERHRDRERDRHH ::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 HRSRERSPSRSRESSRRHRDLLHNEDRHDDYFQERNREHERHRDRERDRHH 420 430 440 450 460 >>CCDS8988.1 CPSF6 gene_id:11052|Hs108|chr12 (551 aa) initn: 871 init1: 525 opt: 812 Z-score: 379.1 bits: 79.7 E(32554): 8.6e-15 Smith-Waterman score: 1228; 45.3% identity (63.1% similar) in 510 aa overlap (43-469:48-538) 20 30 40 50 60 70 pF1KB4 DEEFNQDPEFNNTDQIDLYDDVLTATSQPSDDRSSSTEPPPPVRQEPSPKPNNKTPAILY .::. :: : .. . .. .: ..: CCDS89 FNQEAEYGGHDQIDLYDDVISPSANNGDAPEDRDYMDTLPPTVGDDVG---KGAAPNVVY 20 30 40 50 60 70 80 90 100 110 120 130 pF1KB4 TYSGLRNRRAAVYVGSFSWWTTDQQLIQVIRSIGVYDVVELKFAENRANGQSKGYAEVVV ::.: .: :.:.:...:::::..: ....:.:: :..:.:: ::::::::::.: : : CCDS89 TYTG---KRIALYIGNLTWWTTDEDLTEAVHSLGVNDILEIKFFENRANGQSKGFALVGV 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 ASENSVHKLLELLPGKVLNGEKVDVRPATRQNLSQFEAQARKRECVRVPRG---GIPPRA .:: : .::..::: . :.:.. : : ..: ::::: :.:: : . :: . CCDS89 GSEASSKKLMDLLPKRELHGQNPVVTPCNKQFLSQFEMQSRKTTQSGQMSGEGKAGPPGG 140 150 160 170 180 190 190 200 210 220 230 240 pF1KB4 HSRDS-SDSADGR-----ATPSENLVPSSARVDKPPSVLPYFNRPPSALPLMGLPPPPIP :: . ... :: :.:. . :. : :: .: . :: : .: : :: : CCDS89 SSRAAFPQGGRGRGRFPGAVPGGDRFPGPAGPGGPPPPFPAGQTPPR--PPLGPPGPPGP 200 210 220 230 240 250 260 pF1KB4 P---------PPPLSSS-----------------FGVPP----------------PPPGI : ::::.. :: :: :::: CCDS89 PGPPPPGQVLPPPLAGPPNRGDRPPPPVLFPGQPFGQPPLGPLPPGPPPPVPGYGPPPGP 250 260 270 280 290 300 270 280 290 300 pF1KB4 HYQHLMPPPP----------------RL--PPHLAVPPPGAIPPALHLNPAFFPPPNAT- . :::: : :::: ::::: ::: :.::::::::. . CCDS89 PPPQQGPPPPPGPFPPRPPGPLGPPLTLAPPPHLPGPPPGAPPPAPHVNPAFFPPPTNSG 310 320 330 340 350 360 310 320 330 340 pF1KB4 ------VGPPPDTYMKASAPYNHHGSRDSGPPP-------STVSEAEFEDIMKRNRAISS :::: . ::.. : : ::: . .::::::.::.::::::: CCDS89 MPTSDSRGPPPTDPYGRPPPYDR-G--DYGPPGREMDTARTPLSEAEFEEIMNRNRAISS 370 380 390 400 410 420 350 360 370 380 390 400 pF1KB4 SAISKAVSGASAGDYSDAIETLLTAIAVIKQSRVANDERCRVLISSLKDCLHGIEAKSYS ::::.::: ::::::..:::::.:::..::::.:. :.::.::::::.:::::::.::: CCDS89 SAISRAVSDASAGDYGSAIETLVTAISLIKQSKVSADDRCKVLISSLQDCLHGIESKSY- 430 440 450 460 470 480 410 420 430 440 450 460 pF1KB4 VGASGSSSRKRHRSRERSPSRSRESSRRHRDLLHNEDRHDDYFQERNREHERHRDRERDR ::.:: :.:::::. :::::.::::.. ...::::::..::.::.::::::.::: CCDS89 ----GSGSR-RERSRERDHSRSREKSRRHKS--RSRDRHDDYYRERSRERERHRDRDRDR 490 500 510 520 530 470 pF1KB4 HH CCDS89 DRERDREREYRHR 540 550 >>CCDS73494.1 CPSF6 gene_id:11052|Hs108|chr12 (588 aa) initn: 1094 init1: 525 opt: 812 Z-score: 378.7 bits: 79.7 E(32554): 9e-15 Smith-Waterman score: 1103; 44.2% identity (60.6% similar) in 505 aa overlap (84-469:83-575) 60 70 80 90 100 110 pF1KB4 PVRQEPSPKPNNKTPAILYTYSGLRNRRAAVYVGSFSWWTTDQQLIQVIRSIGVYDVVEL .:.:...:::::..: ....:.:: :..:. CCDS73 MDTLPPTVGDDVGKGAAPNVVYTYTGKRIALYIGNLTWWTTDEDLTEAVHSLGVNDILEI 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB4 KFAENRANGQSKGYAEVVVASENSVHKLLELLPGKVLNGEKVDVRPATRQNLSQFEAQAR :: ::::::::::.: : :.:: : .::..::: . :.:.. : : ..: ::::: :.: CCDS73 KFFENRANGQSKGFALVGVGSEASSKKLMDLLPKRELHGQNPVVTPCNKQFLSQFEMQSR 120 130 140 150 160 170 180 190 200 210 220 pF1KB4 KRECVRVPRG---GIPPRAHSRDS-SDSADGR-----ATPSENLVPSSARVDKPPSVLP- : : . :: . :: . ... :: :.:. . :. : :: .: CCDS73 KTTQSGQMSGEGKAGPPGGSSRAAFPQGGRGRGRFPGAVPGGDRFPGPAGPGGPPPPFPG 180 190 200 210 220 230 230 240 pF1KB4 -------YFNRP-------P-------SALPLMGL---------------------PPPP .:: : .:..:: :::: CCDS73 NLIKHLVKGTRPLFLETRIPWHMGHSIEEIPIFGLKAGQTPPRPPLGPPGPPGPPGPPPP 240 250 260 270 280 290 250 260 pF1KB4 ---IPPP------------PPL---SSSFGVPP----------------PPPGIHYQHLM .::: ::. .. :: :: :::: . CCDS73 GQVLPPPLAGPPNRGDRPPPPVLFPGQPFGQPPLGPLPPGPPPPVPGYGPPPGPPPPQQG 300 310 320 330 340 350 270 280 290 300 pF1KB4 PPPP----------------RL--PPHLAVPPPGAIPPALHLNPAFFPPPNAT------- :::: : :::: ::::: ::: :.::::::::. . CCDS73 PPPPPGPFPPRPPGPLGPPLTLAPPPHLPGPPPGAPPPAPHVNPAFFPPPTNSGMPTSDS 360 370 380 390 400 410 310 320 330 340 350 pF1KB4 VGPPP-DTYMKASAPYNHHGSRDSGPPP-------STVSEAEFEDIMKRNRAISSSAISK :::: : : . ::.. : : ::: . .::::::.::.:::::::::::. CCDS73 RGPPPTDPYGRPP-PYDR-G--DYGPPGREMDTARTPLSEAEFEEIMNRNRAISSSAISR 420 430 440 450 460 360 370 380 390 400 410 pF1KB4 AVSGASAGDYSDAIETLLTAIAVIKQSRVANDERCRVLISSLKDCLHGIEAKSYSVGASG ::: ::::::..:::::.:::..::::.:. :.::.::::::.:::::::.::: : CCDS73 AVSDASAGDYGSAIETLVTAISLIKQSKVSADDRCKVLISSLQDCLHGIESKSY-----G 470 480 490 500 510 520 420 430 440 450 460 470 pF1KB4 SSSRKRHRSRERSPSRSRESSRRHRDLLHNEDRHDDYFQERNREHERHRDRERDRHH :.:: :.:::::. :::::.::::.. ...::::::..::.::.::::::.::: CCDS73 SGSR-RERSRERDHSRSREKSRRHKS--RSRDRHDDYYRERSRERERHRDRDRDRDRERD 530 540 550 560 570 580 CCDS73 REREYRHR 471 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 05:40:34 2016 done: Sat Nov 5 05:40:34 2016 Total Scan time: 3.660 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]