FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB0087, 1140 aa 1>>>pF1KB0087 1140 - 1140 aa - 1140 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.0562+/-0.00132; mu= 17.2651+/- 0.079 mean_var=58.9417+/-11.666, 0's: 0 Z-trim(98.6): 32 B-trim: 41 in 1/48 Lambda= 0.167056 statistics sampled from 5427 (5431) to 5427 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.498), E-opt: 0.2 (0.167), width: 16 Scan time: 4.770 The best scores are: opt bits E(32554) CCDS31576.1 DDB1 gene_id:1642|Hs108|chr11 (1140) 7452 1805.3 0 CCDS10894.1 SF3B3 gene_id:23450|Hs108|chr16 (1217) 367 97.7 1.7e-19 CCDS34966.1 CPSF1 gene_id:29894|Hs108|chr8 (1443) 257 71.2 1.9e-11 >>CCDS31576.1 DDB1 gene_id:1642|Hs108|chr11 (1140 aa) initn: 7452 init1: 7452 opt: 7452 Z-score: 9692.4 bits: 1805.3 E(32554): 0 Smith-Waterman score: 7452; 100.0% identity (100.0% similar) in 1140 aa overlap (1-1140:1-1140) 10 20 30 40 50 60 pF1KB0 MSYNYVVTAQKPTAVNGCVTGHFTSAEDLNLLIAKNTRLEIYVVTAEGLRPVKEVGMYGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MSYNYVVTAQKPTAVNGCVTGHFTSAEDLNLLIAKNTRLEIYVVTAEGLRPVKEVGMYGK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB0 IAVMELFRPKGESKDLLFILTAKYNACILEYKQSGESIDIITRAHGNVQDRIGRPSETGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 IAVMELFRPKGESKDLLFILTAKYNACILEYKQSGESIDIITRAHGNVQDRIGRPSETGI 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB0 IGIIDPECRMIGLRLYDGLFKVIPLDRDNKELKAFNIRLEELHVIDVKFLYGCQAPTICF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 IGIIDPECRMIGLRLYDGLFKVIPLDRDNKELKAFNIRLEELHVIDVKFLYGCQAPTICF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB0 VYQDPQGRHVKTYEVSLREKEFNKGPWKQENVEAEASMVIAVPEPFGGAIIIGQESITYH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 VYQDPQGRHVKTYEVSLREKEFNKGPWKQENVEAEASMVIAVPEPFGGAIIIGQESITYH 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB0 NGDKYLAIAPPIIKQSTIVCHNRVDPNGSRYLLGDMEGRLFMLLLEKEEQMDGTVTLKDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 NGDKYLAIAPPIIKQSTIVCHNRVDPNGSRYLLGDMEGRLFMLLLEKEEQMDGTVTLKDL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB0 RVELLGETSIAECLTYLDNGVVFVGSRLGDSQLVKLNVDSNEQGSYVVAMETFTNLGPIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 RVELLGETSIAECLTYLDNGVVFVGSRLGDSQLVKLNVDSNEQGSYVVAMETFTNLGPIV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB0 DMCVVDLERQGQGQLVTCSGAFKEGSLRIIRNGIGIHEHASIDLPGIKGLWPLRSDPNRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 DMCVVDLERQGQGQLVTCSGAFKEGSLRIIRNGIGIHEHASIDLPGIKGLWPLRSDPNRE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB0 TDDTLVLSFVGQTRVLMLNGEEVEETELMGFVDDQQTFFCGNVAHQQLIQITSASVRLVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 TDDTLVLSFVGQTRVLMLNGEEVEETELMGFVDDQQTFFCGNVAHQQLIQITSASVRLVS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB0 QEPKALVSEWKEPQAKNISVASCNSSQVVVAVGRALYYLQIHPQELRQISHTEMEHEVAC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 QEPKALVSEWKEPQAKNISVASCNSSQVVVAVGRALYYLQIHPQELRQISHTEMEHEVAC 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB0 LDITPLGDSNGLSPLCAIGLWTDISARILKLPSFELLHKEMLGGEIIPRSILMTTFESSH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LDITPLGDSNGLSPLCAIGLWTDISARILKLPSFELLHKEMLGGEIIPRSILMTTFESSH 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB0 YLLCALGDGALFYFGLNIETGLLSDRKKVTLGTQPTVLRTFRSLSTTNVFACSDRPTVIY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 YLLCALGDGALFYFGLNIETGLLSDRKKVTLGTQPTVLRTFRSLSTTNVFACSDRPTVIY 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB0 SSNHKLVFSNVNLKEVNYMCPLNSDGYPDSLALANNSTLTIGTIDEIQKLHIRTVPLYES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SSNHKLVFSNVNLKEVNYMCPLNSDGYPDSLALANNSTLTIGTIDEIQKLHIRTVPLYES 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB0 PRKICYQEVSQCFGVLSSRIEVQDTSGGTTALRPSASTQALSSSVSSSKLFSSSTAPHET :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 PRKICYQEVSQCFGVLSSRIEVQDTSGGTTALRPSASTQALSSSVSSSKLFSSSTAPHET 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB0 SFGEEVEVHNLLIIDQHTFEVLHAHQFLQNEYALSLVSCKLGKDPNTYFIVGTAMVYPEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SFGEEVEVHNLLIIDQHTFEVLHAHQFLQNEYALSLVSCKLGKDPNTYFIVGTAMVYPEE 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB0 AEPKQGRIVVFQYSDGKLQTVAEKEVKGAVYSMVEFNGKLLASINSTVRLYEWTTEKELR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 AEPKQGRIVVFQYSDGKLQTVAEKEVKGAVYSMVEFNGKLLASINSTVRLYEWTTEKELR 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB0 TECNHYNNIMALYLKTKGDFILVGDLMRSVLLLAYKPMEGNFEEIARDFNPNWMSAVEIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 TECNHYNNIMALYLKTKGDFILVGDLMRSVLLLAYKPMEGNFEEIARDFNPNWMSAVEIL 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB0 DDDNFLGAENAFNLFVCQKDSAATTDEERQHLQEVGLFHLGEFVNVFCHGSLVMQNLGET :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 DDDNFLGAENAFNLFVCQKDSAATTDEERQHLQEVGLFHLGEFVNVFCHGSLVMQNLGET 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KB0 STPTQGSVLFGTVNGMIGLVTSLSESWYNLLLDMQNRLNKVIKSVGKIEHSFWRSFHTER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 STPTQGSVLFGTVNGMIGLVTSLSESWYNLLLDMQNRLNKVIKSVGKIEHSFWRSFHTER 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KB0 KTEPATGFIDGDLIESFLDISRPKMQEVVANLQYDDGSGMKREATADDLIKVVEELTRIH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 KTEPATGFIDGDLIESFLDISRPKMQEVVANLQYDDGSGMKREATADDLIKVVEELTRIH 1090 1100 1110 1120 1130 1140 >>CCDS10894.1 SF3B3 gene_id:23450|Hs108|chr16 (1217 aa) initn: 376 init1: 160 opt: 367 Z-score: 463.5 bits: 97.7 E(32554): 1.7e-19 Smith-Waterman score: 848; 23.4% identity (54.4% similar) in 1203 aa overlap (19-1112:18-1197) 10 20 30 40 50 pF1KB0 MSYNYVVTAQKPTAVNGCVTGHFTSAEDLNLLIAKNTRLEIYVVTAEG--LRPVKEVGMY . :.:..... ....... ::. . .. . : .. CCDS10 MFLYNLTLQRATGISFAIHGNFSGTKQQEIVVSRGKILELLRPDPNTGKVHTLLTVEVF 10 20 30 40 50 60 70 80 90 100 110 pF1KB0 GKIAVMELFRPKGESKDLLFILTAKYNACILEYKQSGESIDIITRAHGNVQDRIG-RPSE : : . :: : .:: . . . . ::::. : ... . : .. . : : CCDS10 GVIRSLMAFRLTGGTKDYIVVGSDSGRIVILEYQPSK---NMFEKIHQETFGKSGCRRIV 60 70 80 90 100 110 120 130 140 150 160 pF1KB0 TGIIGIIDPECRMIGLRLYDGLFKVIPLDRD-------NKELKAFNIRLEELHVI--DVK : . .::. : . . . : :.:: .. :.: . ::. :: CCDS10 PGQFLAVDPKGRAVMISAIEKQKLVYILNRDAAARLTISSPLEAHKANTLVYHVVGVDVG 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB0 F---LYGCQAPTICFVYQDPQGRHVKTYEVSLREKEFNKGPWK-----QENVEAEASMVI : ...: . .:: :. . . . .: :.. : . .: .: .....: CCDS10 FENPMFACLEMDYEEADNDPTGEAAANTQQTLTFYELDLGLNHVVRKYSEPLEEHGNFLI 180 190 200 210 220 230 230 240 250 260 pF1KB0 AVP---EPFGGAIIIGQESITYHN-GDKYLAIAPPIIKQST----------IVCHNRVDP .:: . .:..: ... :::.: ::. : :: .. . .:: CCDS10 TVPGGSDGPSGVLICSENYITYKNFGDQP-DIRCPIPRRRNDLDDPERGMIFVCSATHKT 240 250 260 270 280 290 270 280 290 300 310 320 pF1KB0 NGSRYLLGDME-GRLFMLLLEKEEQMDGTVTLKDLRVELLGETSIAECLTYLDNGVVFVG .. ..:.. : : .: . :: .:.: :: ..:.. . . .: . : .: .::. CCDS10 KSMFFFLAQTEQGDIFKITLETDEDM---VT--EIRLKYFDTVPVAAAMCVLKTGFLFVA 300 310 320 330 340 350 330 340 350 360 pF1KB0 SRLGDSQLVKLNV--DSNEQGSYVVAM-----ETF----------------TNLGPIVDM :..:. : .. :..:. . :: .:: .:.::. CCDS10 SEFGNHYLYQIAHLGDDDEEPEFSSAMPLEEGDTFFFQPRPLKNLVLVDELDSLSPILFC 360 370 380 390 400 410 370 380 390 400 410 420 pF1KB0 CVVDLERQGQGQLVTCSGAFKEGSLRIIRNGIGIHEHASIDLPGI-KGLWPLRSDPNRET ..:: . :: . : ..:::..:.:. . : : .::: ...: .: . : CCDS10 QIADLANEDTPQLYVACGRGPRSSLRVLRHGLEVSEMAVSELPGNPNAVWTVRRHIEDEF 420 430 440 450 460 470 430 440 450 460 470 480 pF1KB0 DDTLVLSFVGQTRVLMLNGEEVEETELMGFVDDQQTFFCGNVAHQQLIQITSASVRLVSQ : ...:::. : :: . :: :::. ::. :. :. .. . :.:. ..: . CCDS10 DAYIIVSFVNATLVLSI-GETVEEVTDSGFLGTTPTLSCSLLGDDALVQVYPDGIRHIRA 480 490 500 510 520 490 500 510 520 530 pF1KB0 EPKALVSEWKEPQAKNISVASCNSSQVVVAV-GRALYYLQIHPQ-ELRQISHT-EMEHEV . . :.::: : :.: . :. :::.:. : : :... :. .: . .. :: .: CCDS10 DKR--VNEWKTPGKKTIVKCAVNQRQVVIALTGGELVYFEMDPSGQLNEYTERKEMSADV 530 540 550 560 570 580 540 550 560 570 580 590 pF1KB0 ACLDITPLGDSNGLSPLCAIGLWTDISARILKL-PSFELLHKEMLGGEIIPRSILMTTFE .:.... . .. : . :.:: .: ..::..: :: : : . :.:. .. . CCDS10 VCMSLANVPPGEQRSRFLAVGL-VDNTVRIISLDPSDCLQPLSMQALPAQPESLCIVEMG 590 600 610 620 630 640 600 610 620 630 640 pF1KB0 SSH--------------YLLCALGDGALFYFGLNIETGLLSDRKKVTLGTQPTVLRTFRS ... :: .: .:.:. :. :: ::: . ::..:. : : CCDS10 GTEKQDELGERGSIGFLYLNIGLQNGVLLRTVLDPVTGDLSDTRTRYLGSRPVKLFRVRM 650 660 670 680 690 700 650 660 670 680 690 700 pF1KB0 LSTTNVFACSDRPTVIYSSNHKLVFSNVNLKEVNYMCPLNSDGYPDSLALANNSTLTIGT . :.: :.: . :: . .. .. .. . ... . :. :.... ...:: : . CCDS10 QGQEAVLAMSSRSWLSYSYQSRFHLTPLSYETLEFASGFASEQCPEGIVAISTNTLRILA 710 720 730 740 750 760 710 720 730 740 750 pF1KB0 IDEIQKLHIRTV-PLYESPRKICYQEVSQCFGVLSSR-------IEVQDTSGGTTALRPS .... . ... :: .:::. . :. . .. . ..: . . . . CCDS10 LEKLGAVFNQVAFPLQYTPRKFVIHPESNNLIIIETDHNAYTEATKAQRKQQMAEEMVEA 770 780 790 800 810 820 760 770 780 790 800 810 pF1KB0 ASTQALSSSVSSSKLFSSSTAPHETSFGEEVEVHN-----LLIIDQHTFEVLHAHQFLQN :. . .. . : . . : :. :: .. . ... ..: :. :: CCDS10 AGEDERELAAEMAAAFLNENLP-ESIFGAPKAGNGQWASVIRVMNPIQGNTLDLVQLEQN 830 840 850 860 870 880 820 830 840 850 860 pF1KB0 EYALSLVSCKLGKDPNTYFI-VGTA---MVYPEEAEPKQGRIVVFQY-SDG-KLQTVAEK : :.:.. :.... . ... ::.: .. :. . : . ... ..: ::. . . CCDS10 EAAFSVAVCRFSNTGEDWYVLVGVAKDLILNPRSVA--GGFVYTYKLVNNGEKLEFLHKT 890 900 910 920 930 940 870 880 890 900 910 920 pF1KB0 EVKGAVYSMVEFNGKLLASINSTVRLYEWTTEKELRT-ECNHYNNIMALYLKTKGDFILV :. . ... :.:..: .... .:.:. .: :: : .: : .. ..: : ..: CCDS10 PVEEVPAAIAPFQGRVLIGVGKLLRVYDLGKKKLLRKCENKHIANYIS-GIQTIGHRVIV 950 960 970 980 990 1000 930 940 950 960 970 980 pF1KB0 GDLMRSVLLLAYKPMEGNFEEIARDFNPNWMSAVEILDDDNFLGAENAFNLFVCQ--KDS .:...: . . :: :... .: : : :.... .:: :. ::.. :. : . .. CCDS10 SDVQESFIWVRYKRNENQLIIFADDTYPRWVTTASLLDYDTVAGADKFGNICVVRLPPNT 1010 1020 1030 1040 1050 1060 990 1000 1010 1020 1030 pF1KB0 AATTDEE---RQHLQEVGLFH----LGEFVNVFCHGSLVMQNLGETSTPTQGS--VLFGT .::. . : . ::.. .: . . : :. .: .:. :: ... : CCDS10 NDEVDEDPTGNKALWDRGLLNGASQKAEVIMNYHVGETVL-SLQKTTLIPGGSESLVYTT 1070 1080 1090 1100 1110 1120 1040 1050 1060 1070 1080 1090 pF1KB0 VNGMIG-LVTSLSESWYNLLLDMQNRLNKVIKSVGKIEHSFWRSFHTERKTEPATGFIDG ..: :: :: :. .... .. .: . . .: .::.. :. . ::: CCDS10 LSGGIGILVPFTSHEDHDFFQHVEMHLRSEHPPLCGRDHLSFRSYYF-----PVKNVIDG 1130 1140 1150 1160 1170 1100 1110 1120 1130 1140 pF1KB0 DLIESFLDISRPKMQEVVANLQYDDGSGMKREATADDLIKVVEELTRIH :: :.: .. :...: .: CCDS10 DLCEQFNSMEPNKQKNVSEELDRTPPEVSKKLEDIRTRYAF 1180 1190 1200 1210 >>CCDS34966.1 CPSF1 gene_id:29894|Hs108|chr8 (1443 aa) initn: 291 init1: 98 opt: 257 Z-score: 318.8 bits: 71.2 E(32554): 1.9e-11 Smith-Waterman score: 312; 21.7% identity (55.5% similar) in 530 aa overlap (638-1131:931-1435) 610 620 630 640 650 660 pF1KB0 DGALFYFGLNIETGLLSDRKKVTLGTQPTVLRTFRSL-STTNVFACSDRPTVIYSSNHKL .: :... . ..:: :. : : : CCDS34 FREKKPKPSKKKAEGGGAEEGAGARGRVARFRYFEDIYGYSGVFICGPSP-------HWL 910 920 930 940 950 670 680 690 700 710 720 pF1KB0 VFSNVNLKEVNYMCPLNSDGYPDSLALANNSTLTIGTI--DEIQKLHIRTVPLY---ESP . .. . . . :. :: ::.: .: . : . .. .:.: ..: : ..: CCDS34 LVTG---RGALRLHPMAIDGPVDSFAPFHNVNCPRGFLYFNRQGELRISVLPAYLSYDAP 960 970 980 990 1000 1010 730 740 750 760 770 780 pF1KB0 RKICYQEVSQCFGVLSSRIEVQDTSGGTTALRPSASTQALSSSVSSSKLFSSSTAPHETS . . .. ..: . . .:.. : : ... : : . : CCDS34 WPVRKIPLRCTAHYVAYHVESKVYAVATSTNTPCARIPRMTGE---EKEFET-IERDERY 1020 1030 1040 1050 1060 790 800 810 820 830 pF1KB0 FGEEVEVHNLLIIDQHTFEVL-HAHQFLQN-EYALSLVSCKLGKDPNT-----YFIVGTA . . :. .. .:. ..:.. .:. ::. :.. . . .: .. .. : .:: CCDS34 IHPQQEAFSIQLISPVSWEAIPNARIELQEWEHVTCMKTVSLRSEETVSGLKGYVAAGTC 1070 1080 1090 1100 1110 1120 840 850 860 870 880 pF1KB0 MVYPEEAEPKQGRIVVFQY-----------SDGKLQTVAEKEVKGAVYSMVEFNGKLLAS .. ::. . :::.... . .:.... ::: :: : .. . ::.:... CCDS34 LMQGEEVTCR-GRILIMDVIEVVPEPGQPLTKNKFKVLYEKEQKGPVTALCHCNGHLVSA 1130 1140 1150 1160 1170 1180 890 900 910 920 930 940 pF1KB0 INSTVRLYEWTTEKELRTECNHYNNIMALY-LKTKGDFILVGDLMRSVLLLAYKPMEGNF :.. ... :. . : .. . .. . . .:::..:.:.:. :: :. .. CCDS34 IGQ--KIFLWSLRASELTGMAFIDTQLYIHQMISVKNFILAADVMKSISLLRYQEESKTL 1190 1200 1210 1220 1230 1240 950 960 970 980 990 pF1KB0 EEIARDFNPNWMSAVEILDDD---NFLGAENAFNLFVCQKDSAATTDEERQHLQEVGLFH ..:: .: . .:... :. .:: .. ::.: . : . ..: . . :: CCDS34 SLVSRDAKPLEVYSVDFMVDNAQLGFLVSDRDRNLMVYMYLPEAKESFGGMRLLRRADFH 1250 1260 1270 1280 1290 1300 1000 1010 1020 1030 1040 1050 pF1KB0 LGEFVNVF----CHGSLVMQNLGETSTPTQGSVL--FGTVNGMIGLVTSLSESWYNLLLD .: ::.: :.:. ..:.. :. ... . :.:..: :::. ..:. : :: CCDS34 VGAHVNTFWRTPCRGAT--EGLSKKSVVWENKHITWFATLDGGIGLLLPMQEKTYRRLLM 1310 1320 1330 1340 1350 1360 1060 1070 1080 1090 1100 1110 pF1KB0 MQNRLNKVIKSVGKIEHSFWRSFHTERKT--EPATGFIDGDLIESFLDISRPKMQEVVAN .:: :. .. . .. .: .:..:.: . . . .::.:.. .: .: . .:.. . CCDS34 LQNALTTMLPHHAGLNPRAFRMLHVDRRTLQNAVRNVLDGELLNRYLYLSTMERSELAKK 1370 1380 1390 1400 1410 1420 1120 1130 1140 pF1KB0 LQYDDGSGMKREATADDLIKVVEELTRIH . : . :::.. CCDS34 I------GTTPDIILDDLLETDRVTAHF 1430 1440 1140 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 11:37:14 2016 done: Thu Nov 3 11:37:15 2016 Total Scan time: 4.770 Total Display time: 0.150 Function used was FASTA [36.3.4 Apr, 2011]