FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7296, 1333 aa 1>>>pF1KB7296 1333 - 1333 aa - 1333 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 15.5289+/-0.00145; mu= -25.5155+/- 0.087 mean_var=556.1482+/-115.720, 0's: 0 Z-trim(112.9): 63 B-trim: 231 in 1/53 Lambda= 0.054385 statistics sampled from 13516 (13574) to 13516 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.718), E-opt: 0.2 (0.417), width: 16 Scan time: 6.180 The best scores are: opt bits E(32554) CCDS1802.1 SOS1 gene_id:6654|Hs108|chr2 (1333) 8954 718.6 2.7e-206 CCDS9697.1 SOS2 gene_id:6655|Hs108|chr14 (1332) 6229 504.8 6.2e-142 >>CCDS1802.1 SOS1 gene_id:6654|Hs108|chr2 (1333 aa) initn: 8954 init1: 8954 opt: 8954 Z-score: 3817.1 bits: 718.6 E(32554): 2.7e-206 Smith-Waterman score: 8954; 100.0% identity (100.0% similar) in 1333 aa overlap (1-1333:1-1333) 10 20 30 40 50 60 pF1KB7 MQAQQLPYEFFSEENAPKWRGLLVPALKKVQGQVHPTLESNDDALQYVEELILQLLNMLC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 MQAQQLPYEFFSEENAPKWRGLLVPALKKVQGQVHPTLESNDDALQYVEELILQLLNMLC 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 QAQPRSASDVEERVQKSFPHPIDKWAIADAQSAIEKRKRRNPLSLPVEKIHPLLKEVLGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 QAQPRSASDVEERVQKSFPHPIDKWAIADAQSAIEKRKRRNPLSLPVEKIHPLLKEVLGY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 KIDHQVSVYIVAVLEYISADILKLVGNYVRNIRHYEITKQDIKVAMCADKVLMDMFHQDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 KIDHQVSVYIVAVLEYISADILKLVGNYVRNIRHYEITKQDIKVAMCADKVLMDMFHQDV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 EDINILSLTDEEPSTSGEQTYYDLVKAFMAEIRQYIRELNLIIKVFREPFVSNSKLFSAN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 EDINILSLTDEEPSTSGEQTYYDLVKAFMAEIRQYIRELNLIIKVFREPFVSNSKLFSAN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 DVENIFSRIVDIHELSVKLLGHIEDTVEMTDEGSPHPLVGSCFEDLAEELAFDPYESYAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 DVENIFSRIVDIHELSVKLLGHIEDTVEMTDEGSPHPLVGSCFEDLAEELAFDPYESYAR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 DILRPGFHDRFLSQLSKPGAALYLQSIGEGFKEAVQYVLPRLLLAPVYHCLHYFELLKQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 DILRPGFHDRFLSQLSKPGAALYLQSIGEGFKEAVQYVLPRLLLAPVYHCLHYFELLKQL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 EEKSEDQEDKECLKQAITALLNVQSGMEKICSKSLAKRRLSESACRFYSQQMKGKQLAIK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 EEKSEDQEDKECLKQAITALLNVQSGMEKICSKSLAKRRLSESACRFYSQQMKGKQLAIK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB7 KMNEIQKNIDGWEGKDIGQCCNEFIMEGTLTRVGAKHERHIFLFDGLMICCKSNHGQPRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 KMNEIQKNIDGWEGKDIGQCCNEFIMEGTLTRVGAKHERHIFLFDGLMICCKSNHGQPRL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB7 PGASNAEYRLKEKFFMRKVQINDKDDTNEYKHAFEIILKDENSVIFSAKSAEEKNNWMAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 PGASNAEYRLKEKFFMRKVQINDKDDTNEYKHAFEIILKDENSVIFSAKSAEEKNNWMAA 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB7 LISLQYRSTLERMLDVTMLQEEKEEQMRLPSADVYRFAEPDSEENIIFEENMQPKAGIPI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 LISLQYRSTLERMLDVTMLQEEKEEQMRLPSADVYRFAEPDSEENIIFEENMQPKAGIPI 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB7 IKAGTVIKLIERLTYHMYADPNFVRTFLTTYRSFCKPQELLSLIIERFEIPEPEPTEADR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 IKAGTVIKLIERLTYHMYADPNFVRTFLTTYRSFCKPQELLSLIIERFEIPEPEPTEADR 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB7 IAIENGDQPLSAELKRFRKEYIQPVQLRVLNVCRHWVEHHFYDFERDAYLLQRMEEFIGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 IAIENGDQPLSAELKRFRKEYIQPVQLRVLNVCRHWVEHHFYDFERDAYLLQRMEEFIGT 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB7 VRGKAMKKWVESITKIIQRKKIARDNGPGHNITFQSSPPTVEWHISRPGHIETFDLLTLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 VRGKAMKKWVESITKIIQRKKIARDNGPGHNITFQSSPPTVEWHISRPGHIETFDLLTLH 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB7 PIEIARQLTLLESDLYRAVQPSELVGSVWTKEDKEINSPNLLKMIRHTTNLTLWFEKCIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 PIEIARQLTLLESDLYRAVQPSELVGSVWTKEDKEINSPNLLKMIRHTTNLTLWFEKCIV 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB7 ETENLEERVAVVSRIIEILQVFQELNNFNGVLEVVSAMNSSPVYRLDHTFEQIPSRQKKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 ETENLEERVAVVSRIIEILQVFQELNNFNGVLEVVSAMNSSPVYRLDHTFEQIPSRQKKI 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB7 LEEAHELSEDHYKKYLAKLRSINPPCVPFFGIYLTNILKTEEGNPEVLKRHGKELINFSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 LEEAHELSEDHYKKYLAKLRSINPPCVPFFGIYLTNILKTEEGNPEVLKRHGKELINFSK 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB7 RRKVAEITGEIQQYQNQPYCLRVESDIKRFFENLNPMGNSMEKEFTDYLFNKSLEIEPRN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 RRKVAEITGEIQQYQNQPYCLRVESDIKRFFENLNPMGNSMEKEFTDYLFNKSLEIEPRN 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KB7 PKPLPRFPKKYSYPLKSPGVRPSNPRPGTMRHPTPLQQEPRKISYSRIPESETESTASAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 PKPLPRFPKKYSYPLKSPGVRPSNPRPGTMRHPTPLQQEPRKISYSRIPESETESTASAP 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KB7 NSPRTPLTPPPASGASSTTDVCSVFDSDHSSPFHSSNDTVFIQVTLPHGPRSASVSSISL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 NSPRTPLTPPPASGASSTTDVCSVFDSDHSSPFHSSNDTVFIQVTLPHGPRSASVSSISL 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KB7 TKGTDEVPVPPPVPPRRRPESAPAESSPSKIMSKHLDSPPAIPPRQPTSKAYSPRYSISD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 TKGTDEVPVPPPVPPRRRPESAPAESSPSKIMSKHLDSPPAIPPRQPTSKAYSPRYSISD 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KB7 RTSISDPPESPPLLPPREPVRTPDVFSSSPLHLQPPPLGKKSDHGNAFFPNSPSPFTPPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 RTSISDPPESPPLLPPREPVRTPDVFSSSPLHLQPPPLGKKSDHGNAFFPNSPSPFTPPP 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KB7 PQTPSPHGTRRHLPSPPLTQEVDLHSIAGPPVPPRQSTSQHIPKLPPKTYKREHTHPSMH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 PQTPSPHGTRRHLPSPPLTQEVDLHSIAGPPVPPRQSTSQHIPKLPPKTYKREHTHPSMH 1270 1280 1290 1300 1310 1320 1330 pF1KB7 RDGPPLLENAHSS ::::::::::::: CCDS18 RDGPPLLENAHSS 1330 >>CCDS9697.1 SOS2 gene_id:6655|Hs108|chr14 (1332 aa) initn: 4614 init1: 4562 opt: 6229 Z-score: 2661.6 bits: 504.8 E(32554): 6.2e-142 Smith-Waterman score: 6229; 69.5% identity (85.6% similar) in 1351 aa overlap (1-1332:1-1330) 10 20 30 40 50 60 pF1KB7 MQAQQLPYEFFSEENAPKWRGLLVPALKKVQGQVHPTLESNDDALQYVEELILQLLNMLC :: :::::::::.:::::::: ::.::: :::::: .:...: :.::::.:::: :: CCDS96 MQQAPQPYEFFSEENSPKWRGLLVSALRKVQEQVHPTLSANEESLYYIEELIFQLLNKLC 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 QAQPRSASDVEERVQKSFPHPIDKWAIADAQSAIEKRKRRNPLSLPVEKIHPLLKEVLGY .::::...::::::::.:::::::::::::::::::::::::: :::.:::: ::::::: CCDS96 MAQPRTVQDVEERVQKTFPHPIDKWAIADAQSAIEKRKRRNPLLLPVDKIHPSLKEVLGY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 KIDHQVSVYIVAVLEYISADILKLVGNYVRNIRHYEITKQDIKVAMCADKVLMDMFHQDV :.:..::.::::::::::::::::.:::: :::::::..:::::.::::::::::: :: CCDS96 KVDYHVSLYIVAVLEYISADILKLAGNYVFNIRHYEISQQDIKVSMCADKVLMDMFDQD- 130 140 150 160 170 190 200 210 220 230 240 pF1KB7 EDINILSLTDEEPSTSGEQTYYDLVKAFMAEIRQYIRELNLIIKVFREPFVSNSKLFSAN ::...:: ..:::.::: .:::::.. .:: :::.::::.::::::: :.:. :::. . CCDS96 -DIGLVSLCEDEPSSSGELNYYDLVRTEIAEERQYLRELNMIIKVFREAFLSDRKLFKPS 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB7 DVENIFSRIVDIHELSVKLLGHIEDTVEMTDEGSPHPLVGSCFEDLAEELAFDPYESYAR :.:.::: : :::::.::::: ::::::::::.:::::.:::::::::: ::::::. .. CCDS96 DIEKIFSNISDIHELTVKLLGLIEDTVEMTDESSPHPLAGSCFEDLAEEQAFDPYETLSQ 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB7 DILRPGFHDRFLSQLSKPGAALYLQSIGEGFKEAVQYVLPRLLLAPVYHCLHYFELLKQL ::: : ::..: . ...:..::..:::..::::::.::::::.:.::::: ::::::::: CCDS96 DILSPEFHEHFNKLMARPAVALHFQSIADGFKEAVRYVLPRLMLVPVYHCWHYFELLKQL 300 310 320 330 340 350 370 380 390 400 410 420 pF1KB7 EEKSEDQEDKECLKQAITALLNVQSGMEKICSKSLAKRRLSESACRFYSQQMKGKQLAIK . ::.:::.:::.::::::.:.:..:..: .. .:: .. .: :::.:...:.:::: CCDS96 KACSEEQEDRECLNQAITALMNLQGSMDRIYKQYSPRRRPGDPVCPFYSHQLRSKHLAIK 360 370 380 390 400 410 430 440 450 460 470 480 pF1KB7 KMNEIQKNIDGWEGKDIGQCCNEFIMEGTLTRVGAKHERHIFLFDGLMICCKSNHGQPRL :::::::::::::::::::::::::::: :::.:::::::::::::::: :: :::: :: CCDS96 KMNEIQKNIDGWEGKDIGQCCNEFIMEGPLTRIGAKHERHIFLFDGLMISCKPNHGQTRL 420 430 440 450 460 470 490 500 510 520 530 540 pF1KB7 PGASNAEYRLKEKFFMRKVQINDKDDTNEYKHAFEIILKDENSVIFSAKSAEEKNNWMAA :: :.::::::::: :::.:: ::.:: :.:::::.. :::::.::.::::::::::::: CCDS96 PGYSSAEYRLKEKFVMRKIQICDKEDTCEHKHAFELVSKDENSIIFAAKSAEEKNNWMAA 480 490 500 510 520 530 550 560 570 580 590 600 pF1KB7 LISLQYRSTLERMLDVTMLQEEKEEQMRLPSADVYRFAEPDSEENIIFEENMQPKAGIPI ::::.:::::.:::: ..:.::.:. .:::: .::::. ::::::.::.:.: ..:::: CCDS96 LISLHYRSTLDRMLDSVLLKEENEQPLRLPSPEVYRFVVKDSEENIVFEDNLQSRSGIPI 540 550 560 570 580 590 610 620 630 640 650 660 pF1KB7 IKAGTVIKLIERLTYHMYADPNFVRTFLTTYRSFCKPQELLSLIIERFEIPEPEPTEADR ::.:::.::::::::::::::::::::::::::::::::::::.::::::::::::.::. CCDS96 IKGGTVVKLIERLTYHMYADPNFVRTFLTTYRSFCKPQELLSLLIERFEIPEPEPTDADK 600 610 620 630 640 650 670 680 690 700 710 720 pF1KB7 IAIENGDQPLSAELKRFRKEYIQPVQLRVLNVCRHWVEHHFYDFERDAYLLQRMEEFIGT .:::.:.::.::.::::::::.::::::.::: :::::::::::::: ::.:.: ::.. CCDS96 LAIEKGEQPISADLKRFRKEYVQPVQLRILNVFRHWVEHHFYDFERDLELLERLESFISS 660 670 680 690 700 710 730 740 750 760 770 780 pF1KB7 VRGKAMKKWVESITKIIQRKKIARDNGPGHNITFQSSPPTVEWHISRPGHIETFDLLTLH :::::::::::::.:::.::: :. :: .:::::.: :: .:::::.::..:::::.::: CCDS96 VRGKAMKKWVESIAKIIRRKKQAQANGVSHNITFESPPPPIEWHISKPGQFETFDLMTLH 720 730 740 750 760 770 790 800 810 820 830 840 pF1KB7 PIEIARQLTLLESDLYRAVQPSELVGSVWTKEDKEINSPNLLKMIRHTTNLTLWFEKCIV ::::::::::::::::: :::::::::::::::::::::::::::::::::::::::::: CCDS96 PIEIARQLTLLESDLYRKVQPSELVGSVWTKEDKEINSPNLLKMIRHTTNLTLWFEKCIV 780 790 800 810 820 830 850 860 870 880 890 900 pF1KB7 ETENLEERVAVVSRIIEILQVFQELNNFNGVLEVVSAMNSSPVYRLDHTFEQIPSRQKKI :.::.::::::.:::::::::::.:::::::::.:::.:: ::::::::: . :..:: CCDS96 EAENFEERVAVLSRIIEILQVFQDLNNFNGVLEIVSAVNSVSVYRLDHTFEALQERKRKI 840 850 860 870 880 890 910 920 930 940 950 960 pF1KB7 LEEAHELSEDHYKKYLAKLRSINPPCVPFFGIYLTNILKTEEGNPEVLKRHGKELINFSK :.:: :::.::.::::.::.:::::::::::::::::::::::: . ::..::.:::::: CCDS96 LDEAVELSQDHFKKYLVKLKSINPPCVPFFGIYLTNILKTEEGNNDFLKKKGKDLINFSK 900 910 920 930 940 950 970 980 990 1000 1010 1020 pF1KB7 RRKVAEITGEIQQYQNQPYCLRVESDIKRFFENLNPMGNSMEKEFTDYLFNKSLEIEPRN ::::::::::::::::::::::.: :..::::::::::.. ::::::::::::::::::: CCDS96 RRKVAEITGEIQQYQNQPYCLRIEPDMRRFFENLNPMGSASEKEFTDYLFNKSLEIEPRN 960 970 980 990 1000 1010 1030 1040 1050 1060 1070 pF1KB7 PKPLPRFPKKYSYPLKSPGVRPSNPR----PGTMR-HPTPLQQEPRKISYSRIPESETES : ::::.: .. :::::.::.. : ::.: :::::..:: :::.::: :.: :: CCDS96 CKQPPRFPRKSTFSLKSPGIRPNTGRHGSTSGTLRGHPTPLEREPCKISFSRIAETELES 1020 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 pF1KB7 TASAPNSPRTPLTPPPASGASSTTDVCSVFDSDHSSPFHSSNDTVFIQVTLPHGPRSASV :.:::.:: :: ::: .:...:. .: : .: : ...: : :::. .: CCDS96 TVSAPTSPNTPSTPP----VSASSDLSVFLDVDLNSSCGS--NSIFAPVLLPHS-KSFFS 1080 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 pF1KB7 SSISLTKGTDEVPVPPPVPPRRRPESAPAESSPSKIMSKHLDSPPAIPPRQPTSKAYSPR : :: : ..: .:::.:::.. . ..: :: : :.::::::::: .:: CCDS96 SCGSLHKLSEEPLIPPPLPPRKKFDH---DASNSKGNMKSDDDPPAIPPRQPPPPKVKPR 1140 1150 1160 1170 1180 1200 1210 1220 1230 1240 pF1KB7 YSIS----DRTSISDPPESP----PLLPPREPVRTPDVFSSSPLHLQPPPLG---KKSD- . : : :: : : :: :.: :. : . :..::::::: . :: CCDS96 VPVPTGAFDGPLHSPPPPPPRDPLPDTPPPVPLRPPEHFINCPFNLQPPPLGHLHRDSDW 1190 1200 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 pF1KB7 -HGNAFFPNSPSPFTPPPPQTPSPHGTRR-HLPSPPLTQEVDLHSIAGPPVPPRQSTSQH . . ::::: ::.::::. :: .. : ... .: .:::::::..: : CCDS96 LRDISTCPNSPS----TPPSTPSPRVPRRCYVLS---SSQNNLAHPPAPPVPPRQNSSPH 1250 1260 1270 1280 1290 1300 1310 1320 1330 pF1KB7 IPKLPPKTYKREHTHPSMHRDGPPLLENAHSS .::::::::::: .:: ..: ::::::.. CCDS96 LPKLPPKTYKRELSHPPLYR--LPLLENAETPQ 1310 1320 1330 1333 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 06:39:25 2016 done: Fri Nov 4 06:39:26 2016 Total Scan time: 6.180 Total Display time: 0.160 Function used was FASTA [36.3.4 Apr, 2011]