FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB0087, 1140 aa
1>>>pF1KB0087 1140 - 1140 aa - 1140 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.0562+/-0.00132; mu= 17.2651+/- 0.079
mean_var=58.9417+/-11.666, 0's: 0 Z-trim(98.6): 32 B-trim: 41 in 1/48
Lambda= 0.167056
statistics sampled from 5427 (5431) to 5427 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.498), E-opt: 0.2 (0.167), width: 16
Scan time: 4.770
The best scores are: opt bits E(32554)
CCDS31576.1 DDB1 gene_id:1642|Hs108|chr11 (1140) 7452 1805.3 0
CCDS10894.1 SF3B3 gene_id:23450|Hs108|chr16 (1217) 367 97.7 1.7e-19
CCDS34966.1 CPSF1 gene_id:29894|Hs108|chr8 (1443) 257 71.2 1.9e-11
>>CCDS31576.1 DDB1 gene_id:1642|Hs108|chr11 (1140 aa)
initn: 7452 init1: 7452 opt: 7452 Z-score: 9692.4 bits: 1805.3 E(32554): 0
Smith-Waterman score: 7452; 100.0% identity (100.0% similar) in 1140 aa overlap (1-1140:1-1140)
10 20 30 40 50 60
pF1KB0 MSYNYVVTAQKPTAVNGCVTGHFTSAEDLNLLIAKNTRLEIYVVTAEGLRPVKEVGMYGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 MSYNYVVTAQKPTAVNGCVTGHFTSAEDLNLLIAKNTRLEIYVVTAEGLRPVKEVGMYGK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB0 IAVMELFRPKGESKDLLFILTAKYNACILEYKQSGESIDIITRAHGNVQDRIGRPSETGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 IAVMELFRPKGESKDLLFILTAKYNACILEYKQSGESIDIITRAHGNVQDRIGRPSETGI
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB0 IGIIDPECRMIGLRLYDGLFKVIPLDRDNKELKAFNIRLEELHVIDVKFLYGCQAPTICF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 IGIIDPECRMIGLRLYDGLFKVIPLDRDNKELKAFNIRLEELHVIDVKFLYGCQAPTICF
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB0 VYQDPQGRHVKTYEVSLREKEFNKGPWKQENVEAEASMVIAVPEPFGGAIIIGQESITYH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 VYQDPQGRHVKTYEVSLREKEFNKGPWKQENVEAEASMVIAVPEPFGGAIIIGQESITYH
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB0 NGDKYLAIAPPIIKQSTIVCHNRVDPNGSRYLLGDMEGRLFMLLLEKEEQMDGTVTLKDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 NGDKYLAIAPPIIKQSTIVCHNRVDPNGSRYLLGDMEGRLFMLLLEKEEQMDGTVTLKDL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB0 RVELLGETSIAECLTYLDNGVVFVGSRLGDSQLVKLNVDSNEQGSYVVAMETFTNLGPIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 RVELLGETSIAECLTYLDNGVVFVGSRLGDSQLVKLNVDSNEQGSYVVAMETFTNLGPIV
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB0 DMCVVDLERQGQGQLVTCSGAFKEGSLRIIRNGIGIHEHASIDLPGIKGLWPLRSDPNRE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 DMCVVDLERQGQGQLVTCSGAFKEGSLRIIRNGIGIHEHASIDLPGIKGLWPLRSDPNRE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB0 TDDTLVLSFVGQTRVLMLNGEEVEETELMGFVDDQQTFFCGNVAHQQLIQITSASVRLVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 TDDTLVLSFVGQTRVLMLNGEEVEETELMGFVDDQQTFFCGNVAHQQLIQITSASVRLVS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB0 QEPKALVSEWKEPQAKNISVASCNSSQVVVAVGRALYYLQIHPQELRQISHTEMEHEVAC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 QEPKALVSEWKEPQAKNISVASCNSSQVVVAVGRALYYLQIHPQELRQISHTEMEHEVAC
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB0 LDITPLGDSNGLSPLCAIGLWTDISARILKLPSFELLHKEMLGGEIIPRSILMTTFESSH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LDITPLGDSNGLSPLCAIGLWTDISARILKLPSFELLHKEMLGGEIIPRSILMTTFESSH
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB0 YLLCALGDGALFYFGLNIETGLLSDRKKVTLGTQPTVLRTFRSLSTTNVFACSDRPTVIY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 YLLCALGDGALFYFGLNIETGLLSDRKKVTLGTQPTVLRTFRSLSTTNVFACSDRPTVIY
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB0 SSNHKLVFSNVNLKEVNYMCPLNSDGYPDSLALANNSTLTIGTIDEIQKLHIRTVPLYES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 SSNHKLVFSNVNLKEVNYMCPLNSDGYPDSLALANNSTLTIGTIDEIQKLHIRTVPLYES
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB0 PRKICYQEVSQCFGVLSSRIEVQDTSGGTTALRPSASTQALSSSVSSSKLFSSSTAPHET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 PRKICYQEVSQCFGVLSSRIEVQDTSGGTTALRPSASTQALSSSVSSSKLFSSSTAPHET
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB0 SFGEEVEVHNLLIIDQHTFEVLHAHQFLQNEYALSLVSCKLGKDPNTYFIVGTAMVYPEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 SFGEEVEVHNLLIIDQHTFEVLHAHQFLQNEYALSLVSCKLGKDPNTYFIVGTAMVYPEE
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB0 AEPKQGRIVVFQYSDGKLQTVAEKEVKGAVYSMVEFNGKLLASINSTVRLYEWTTEKELR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 AEPKQGRIVVFQYSDGKLQTVAEKEVKGAVYSMVEFNGKLLASINSTVRLYEWTTEKELR
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB0 TECNHYNNIMALYLKTKGDFILVGDLMRSVLLLAYKPMEGNFEEIARDFNPNWMSAVEIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 TECNHYNNIMALYLKTKGDFILVGDLMRSVLLLAYKPMEGNFEEIARDFNPNWMSAVEIL
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB0 DDDNFLGAENAFNLFVCQKDSAATTDEERQHLQEVGLFHLGEFVNVFCHGSLVMQNLGET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 DDDNFLGAENAFNLFVCQKDSAATTDEERQHLQEVGLFHLGEFVNVFCHGSLVMQNLGET
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KB0 STPTQGSVLFGTVNGMIGLVTSLSESWYNLLLDMQNRLNKVIKSVGKIEHSFWRSFHTER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 STPTQGSVLFGTVNGMIGLVTSLSESWYNLLLDMQNRLNKVIKSVGKIEHSFWRSFHTER
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KB0 KTEPATGFIDGDLIESFLDISRPKMQEVVANLQYDDGSGMKREATADDLIKVVEELTRIH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 KTEPATGFIDGDLIESFLDISRPKMQEVVANLQYDDGSGMKREATADDLIKVVEELTRIH
1090 1100 1110 1120 1130 1140
>>CCDS10894.1 SF3B3 gene_id:23450|Hs108|chr16 (1217 aa)
initn: 376 init1: 160 opt: 367 Z-score: 463.5 bits: 97.7 E(32554): 1.7e-19
Smith-Waterman score: 848; 23.4% identity (54.4% similar) in 1203 aa overlap (19-1112:18-1197)
10 20 30 40 50
pF1KB0 MSYNYVVTAQKPTAVNGCVTGHFTSAEDLNLLIAKNTRLEIYVVTAEG--LRPVKEVGMY
. :.:..... ....... ::. . .. . : ..
CCDS10 MFLYNLTLQRATGISFAIHGNFSGTKQQEIVVSRGKILELLRPDPNTGKVHTLLTVEVF
10 20 30 40 50
60 70 80 90 100 110
pF1KB0 GKIAVMELFRPKGESKDLLFILTAKYNACILEYKQSGESIDIITRAHGNVQDRIG-RPSE
: : . :: : .:: . . . . ::::. : ... . : .. . : :
CCDS10 GVIRSLMAFRLTGGTKDYIVVGSDSGRIVILEYQPSK---NMFEKIHQETFGKSGCRRIV
60 70 80 90 100 110
120 130 140 150 160
pF1KB0 TGIIGIIDPECRMIGLRLYDGLFKVIPLDRD-------NKELKAFNIRLEELHVI--DVK
: . .::. : . . . : :.:: .. :.: . ::. ::
CCDS10 PGQFLAVDPKGRAVMISAIEKQKLVYILNRDAAARLTISSPLEAHKANTLVYHVVGVDVG
120 130 140 150 160 170
170 180 190 200 210 220
pF1KB0 F---LYGCQAPTICFVYQDPQGRHVKTYEVSLREKEFNKGPWK-----QENVEAEASMVI
: ...: . .:: :. . . . .: :.. : . .: .: .....:
CCDS10 FENPMFACLEMDYEEADNDPTGEAAANTQQTLTFYELDLGLNHVVRKYSEPLEEHGNFLI
180 190 200 210 220 230
230 240 250 260
pF1KB0 AVP---EPFGGAIIIGQESITYHN-GDKYLAIAPPIIKQST----------IVCHNRVDP
.:: . .:..: ... :::.: ::. : :: .. . .::
CCDS10 TVPGGSDGPSGVLICSENYITYKNFGDQP-DIRCPIPRRRNDLDDPERGMIFVCSATHKT
240 250 260 270 280 290
270 280 290 300 310 320
pF1KB0 NGSRYLLGDME-GRLFMLLLEKEEQMDGTVTLKDLRVELLGETSIAECLTYLDNGVVFVG
.. ..:.. : : .: . :: .:.: :: ..:.. . . .: . : .: .::.
CCDS10 KSMFFFLAQTEQGDIFKITLETDEDM---VT--EIRLKYFDTVPVAAAMCVLKTGFLFVA
300 310 320 330 340 350
330 340 350 360
pF1KB0 SRLGDSQLVKLNV--DSNEQGSYVVAM-----ETF----------------TNLGPIVDM
:..:. : .. :..:. . :: .:: .:.::.
CCDS10 SEFGNHYLYQIAHLGDDDEEPEFSSAMPLEEGDTFFFQPRPLKNLVLVDELDSLSPILFC
360 370 380 390 400 410
370 380 390 400 410 420
pF1KB0 CVVDLERQGQGQLVTCSGAFKEGSLRIIRNGIGIHEHASIDLPGI-KGLWPLRSDPNRET
..:: . :: . : ..:::..:.:. . : : .::: ...: .: . :
CCDS10 QIADLANEDTPQLYVACGRGPRSSLRVLRHGLEVSEMAVSELPGNPNAVWTVRRHIEDEF
420 430 440 450 460 470
430 440 450 460 470 480
pF1KB0 DDTLVLSFVGQTRVLMLNGEEVEETELMGFVDDQQTFFCGNVAHQQLIQITSASVRLVSQ
: ...:::. : :: . :: :::. ::. :. :. .. . :.:. ..: .
CCDS10 DAYIIVSFVNATLVLSI-GETVEEVTDSGFLGTTPTLSCSLLGDDALVQVYPDGIRHIRA
480 490 500 510 520
490 500 510 520 530
pF1KB0 EPKALVSEWKEPQAKNISVASCNSSQVVVAV-GRALYYLQIHPQ-ELRQISHT-EMEHEV
. . :.::: : :.: . :. :::.:. : : :... :. .: . .. :: .:
CCDS10 DKR--VNEWKTPGKKTIVKCAVNQRQVVIALTGGELVYFEMDPSGQLNEYTERKEMSADV
530 540 550 560 570 580
540 550 560 570 580 590
pF1KB0 ACLDITPLGDSNGLSPLCAIGLWTDISARILKL-PSFELLHKEMLGGEIIPRSILMTTFE
.:.... . .. : . :.:: .: ..::..: :: : : . :.:. .. .
CCDS10 VCMSLANVPPGEQRSRFLAVGL-VDNTVRIISLDPSDCLQPLSMQALPAQPESLCIVEMG
590 600 610 620 630 640
600 610 620 630 640
pF1KB0 SSH--------------YLLCALGDGALFYFGLNIETGLLSDRKKVTLGTQPTVLRTFRS
... :: .: .:.:. :. :: ::: . ::..:. : :
CCDS10 GTEKQDELGERGSIGFLYLNIGLQNGVLLRTVLDPVTGDLSDTRTRYLGSRPVKLFRVRM
650 660 670 680 690 700
650 660 670 680 690 700
pF1KB0 LSTTNVFACSDRPTVIYSSNHKLVFSNVNLKEVNYMCPLNSDGYPDSLALANNSTLTIGT
. :.: :.: . :: . .. .. .. . ... . :. :.... ...:: : .
CCDS10 QGQEAVLAMSSRSWLSYSYQSRFHLTPLSYETLEFASGFASEQCPEGIVAISTNTLRILA
710 720 730 740 750 760
710 720 730 740 750
pF1KB0 IDEIQKLHIRTV-PLYESPRKICYQEVSQCFGVLSSR-------IEVQDTSGGTTALRPS
.... . ... :: .:::. . :. . .. . ..: . . . .
CCDS10 LEKLGAVFNQVAFPLQYTPRKFVIHPESNNLIIIETDHNAYTEATKAQRKQQMAEEMVEA
770 780 790 800 810 820
760 770 780 790 800 810
pF1KB0 ASTQALSSSVSSSKLFSSSTAPHETSFGEEVEVHN-----LLIIDQHTFEVLHAHQFLQN
:. . .. . : . . : :. :: .. . ... ..: :. ::
CCDS10 AGEDERELAAEMAAAFLNENLP-ESIFGAPKAGNGQWASVIRVMNPIQGNTLDLVQLEQN
830 840 850 860 870 880
820 830 840 850 860
pF1KB0 EYALSLVSCKLGKDPNTYFI-VGTA---MVYPEEAEPKQGRIVVFQY-SDG-KLQTVAEK
: :.:.. :.... . ... ::.: .. :. . : . ... ..: ::. . .
CCDS10 EAAFSVAVCRFSNTGEDWYVLVGVAKDLILNPRSVA--GGFVYTYKLVNNGEKLEFLHKT
890 900 910 920 930 940
870 880 890 900 910 920
pF1KB0 EVKGAVYSMVEFNGKLLASINSTVRLYEWTTEKELRT-ECNHYNNIMALYLKTKGDFILV
:. . ... :.:..: .... .:.:. .: :: : .: : .. ..: : ..:
CCDS10 PVEEVPAAIAPFQGRVLIGVGKLLRVYDLGKKKLLRKCENKHIANYIS-GIQTIGHRVIV
950 960 970 980 990 1000
930 940 950 960 970 980
pF1KB0 GDLMRSVLLLAYKPMEGNFEEIARDFNPNWMSAVEILDDDNFLGAENAFNLFVCQ--KDS
.:...: . . :: :... .: : : :.... .:: :. ::.. :. : . ..
CCDS10 SDVQESFIWVRYKRNENQLIIFADDTYPRWVTTASLLDYDTVAGADKFGNICVVRLPPNT
1010 1020 1030 1040 1050 1060
990 1000 1010 1020 1030
pF1KB0 AATTDEE---RQHLQEVGLFH----LGEFVNVFCHGSLVMQNLGETSTPTQGS--VLFGT
.::. . : . ::.. .: . . : :. .: .:. :: ... :
CCDS10 NDEVDEDPTGNKALWDRGLLNGASQKAEVIMNYHVGETVL-SLQKTTLIPGGSESLVYTT
1070 1080 1090 1100 1110 1120
1040 1050 1060 1070 1080 1090
pF1KB0 VNGMIG-LVTSLSESWYNLLLDMQNRLNKVIKSVGKIEHSFWRSFHTERKTEPATGFIDG
..: :: :: :. .... .. .: . . .: .::.. :. . :::
CCDS10 LSGGIGILVPFTSHEDHDFFQHVEMHLRSEHPPLCGRDHLSFRSYYF-----PVKNVIDG
1130 1140 1150 1160 1170
1100 1110 1120 1130 1140
pF1KB0 DLIESFLDISRPKMQEVVANLQYDDGSGMKREATADDLIKVVEELTRIH
:: :.: .. :...: .:
CCDS10 DLCEQFNSMEPNKQKNVSEELDRTPPEVSKKLEDIRTRYAF
1180 1190 1200 1210
>>CCDS34966.1 CPSF1 gene_id:29894|Hs108|chr8 (1443 aa)
initn: 291 init1: 98 opt: 257 Z-score: 318.8 bits: 71.2 E(32554): 1.9e-11
Smith-Waterman score: 312; 21.7% identity (55.5% similar) in 530 aa overlap (638-1131:931-1435)
610 620 630 640 650 660
pF1KB0 DGALFYFGLNIETGLLSDRKKVTLGTQPTVLRTFRSL-STTNVFACSDRPTVIYSSNHKL
.: :... . ..:: :. : : :
CCDS34 FREKKPKPSKKKAEGGGAEEGAGARGRVARFRYFEDIYGYSGVFICGPSP-------HWL
910 920 930 940 950
670 680 690 700 710 720
pF1KB0 VFSNVNLKEVNYMCPLNSDGYPDSLALANNSTLTIGTI--DEIQKLHIRTVPLY---ESP
. .. . . . :. :: ::.: .: . : . .. .:.: ..: : ..:
CCDS34 LVTG---RGALRLHPMAIDGPVDSFAPFHNVNCPRGFLYFNRQGELRISVLPAYLSYDAP
960 970 980 990 1000 1010
730 740 750 760 770 780
pF1KB0 RKICYQEVSQCFGVLSSRIEVQDTSGGTTALRPSASTQALSSSVSSSKLFSSSTAPHETS
. . .. ..: . . .:.. : : ... : : . :
CCDS34 WPVRKIPLRCTAHYVAYHVESKVYAVATSTNTPCARIPRMTGE---EKEFET-IERDERY
1020 1030 1040 1050 1060
790 800 810 820 830
pF1KB0 FGEEVEVHNLLIIDQHTFEVL-HAHQFLQN-EYALSLVSCKLGKDPNT-----YFIVGTA
. . :. .. .:. ..:.. .:. ::. :.. . . .: .. .. : .::
CCDS34 IHPQQEAFSIQLISPVSWEAIPNARIELQEWEHVTCMKTVSLRSEETVSGLKGYVAAGTC
1070 1080 1090 1100 1110 1120
840 850 860 870 880
pF1KB0 MVYPEEAEPKQGRIVVFQY-----------SDGKLQTVAEKEVKGAVYSMVEFNGKLLAS
.. ::. . :::.... . .:.... ::: :: : .. . ::.:...
CCDS34 LMQGEEVTCR-GRILIMDVIEVVPEPGQPLTKNKFKVLYEKEQKGPVTALCHCNGHLVSA
1130 1140 1150 1160 1170 1180
890 900 910 920 930 940
pF1KB0 INSTVRLYEWTTEKELRTECNHYNNIMALY-LKTKGDFILVGDLMRSVLLLAYKPMEGNF
:.. ... :. . : .. . .. . . .:::..:.:.:. :: :. ..
CCDS34 IGQ--KIFLWSLRASELTGMAFIDTQLYIHQMISVKNFILAADVMKSISLLRYQEESKTL
1190 1200 1210 1220 1230 1240
950 960 970 980 990
pF1KB0 EEIARDFNPNWMSAVEILDDD---NFLGAENAFNLFVCQKDSAATTDEERQHLQEVGLFH
..:: .: . .:... :. .:: .. ::.: . : . ..: . . ::
CCDS34 SLVSRDAKPLEVYSVDFMVDNAQLGFLVSDRDRNLMVYMYLPEAKESFGGMRLLRRADFH
1250 1260 1270 1280 1290 1300
1000 1010 1020 1030 1040 1050
pF1KB0 LGEFVNVF----CHGSLVMQNLGETSTPTQGSVL--FGTVNGMIGLVTSLSESWYNLLLD
.: ::.: :.:. ..:.. :. ... . :.:..: :::. ..:. : ::
CCDS34 VGAHVNTFWRTPCRGAT--EGLSKKSVVWENKHITWFATLDGGIGLLLPMQEKTYRRLLM
1310 1320 1330 1340 1350 1360
1060 1070 1080 1090 1100 1110
pF1KB0 MQNRLNKVIKSVGKIEHSFWRSFHTERKT--EPATGFIDGDLIESFLDISRPKMQEVVAN
.:: :. .. . .. .: .:..:.: . . . .::.:.. .: .: . .:.. .
CCDS34 LQNALTTMLPHHAGLNPRAFRMLHVDRRTLQNAVRNVLDGELLNRYLYLSTMERSELAKK
1370 1380 1390 1400 1410 1420
1120 1130 1140
pF1KB0 LQYDDGSGMKREATADDLIKVVEELTRIH
. : . :::..
CCDS34 I------GTTPDIILDDLLETDRVTAHF
1430 1440
1140 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 11:37:14 2016 done: Thu Nov 3 11:37:15 2016
Total Scan time: 4.770 Total Display time: 0.150
Function used was FASTA [36.3.4 Apr, 2011]