FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1034, 733 aa 1>>>pF1KSDA1034 733 - 733 aa - 733 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.4546+/-0.000855; mu= 7.9193+/- 0.053 mean_var=171.9547+/-34.096, 0's: 0 Z-trim(113.5): 10 B-trim: 14 in 1/53 Lambda= 0.097806 statistics sampled from 14128 (14138) to 14128 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.736), E-opt: 0.2 (0.434), width: 16 Scan time: 3.780 The best scores are: opt bits E(32554) CCDS2327.1 SATB2 gene_id:23314|Hs108|chr2 ( 733) 4855 697.1 2.4e-200 CCDS2631.1 SATB1 gene_id:6304|Hs108|chr3 ( 763) 2371 346.7 8.1e-95 CCDS56242.1 SATB1 gene_id:6304|Hs108|chr3 ( 795) 2312 338.3 2.7e-92 >>CCDS2327.1 SATB2 gene_id:23314|Hs108|chr2 (733 aa) initn: 4855 init1: 4855 opt: 4855 Z-score: 3710.3 bits: 697.1 E(32554): 2.4e-200 Smith-Waterman score: 4855; 100.0% identity (100.0% similar) in 733 aa overlap (1-733:1-733) 10 20 30 40 50 60 pF1KSD MERRSESPCLRDSPDRRSGSPDVKGPPPVKVARLEQNGSPMGARGRPNGAVAKAVGGLMI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 MERRSESPCLRDSPDRRSGSPDVKGPPPVKVARLEQNGSPMGARGRPNGAVAKAVGGLMI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD PVFCVVEQLDGSLEYDNREEHAEFVLVRKDVLFSQLVETALLALGYSHSSAAQAQGIIKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 PVFCVVEQLDGSLEYDNREEHAEFVLVRKDVLFSQLVETALLALGYSHSSAAQAQGIIKL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD GRWNPLPLSYVTDAPDATVADMLQDVYHVVTLKIQLQSCSKLEDLPAEQWNHATVRNALK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 GRWNPLPLSYVTDAPDATVADMLQDVYHVVTLKIQLQSCSKLEDLPAEQWNHATVRNALK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD ELLKEMNQSTLAKECPLSQSMISSIVNSTYYANVSATKCQEFGRWYKKYKKIKVERVERE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 ELLKEMNQSTLAKECPLSQSMISSIVNSTYYANVSATKCQEFGRWYKKYKKIKVERVERE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD NLSDYCVLGQRPMHLPNMNQLASLGKTNEQSPHSQIHHSTPIRNQVPALQPIMSPGLLSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 NLSDYCVLGQRPMHLPNMNQLASLGKTNEQSPHSQIHHSTPIRNQVPALQPIMSPGLLSP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD QLSPQLVRQQIAMAHLINQQIAVSRLLAHQHPQAINQQFLNHPPIPRAVKPEPTNSSVEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 QLSPQLVRQQIAMAHLINQQIAVSRLLAHQHPQAINQQFLNHPPIPRAVKPEPTNSSVEV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD SPDIYQQVRDELKRASVSQAVFARVAFNRTQGLLSEILRKEEDPRTASQSLLVNLRAMQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 SPDIYQQVRDELKRASVSQAVFARVAFNRTQGLLSEILRKEEDPRTASQSLLVNLRAMQN 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD FLNLPEVERDRIYQDERERSMNPNVSMVSSASSSPSSSRTPQAKTSTPTTDLPIKVDGAN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 FLNLPEVERDRIYQDERERSMNPNVSMVSSASSSPSSSRTPQAKTSTPTTDLPIKVDGAN 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD INITAAIYDEIQQEMKRAKVSQALFAKVAANKSQGWLCELLRWKENPSPENRTLWENLCT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 INITAAIYDEIQQEMKRAKVSQALFAKVAANKSQGWLCELLRWKENPSPENRTLWENLCT 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD IRRFLNLPQHERDVIYEEESRHHHSERMQHVVQLPPEPVQVLHRQQSQPAKESSPPREEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 IRRFLNLPQHERDVIYEEESRHHHSERMQHVVQLPPEPVQVLHRQQSQPAKESSPPREEA 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD PPPPPPTEDSCAKKPRSRTKISLEALGILQSFIHDVGLYPDQEAIHTLSAQLDLPKHTII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 PPPPPPTEDSCAKKPRSRTKISLEALGILQSFIHDVGLYPDQEAIHTLSAQLDLPKHTII 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD KFFQNQRYHVKHHGKLKEHLGSAVDVAEYKDEELLTESEENDSEEGSEEMYKVEAEEENA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS23 KFFQNQRYHVKHHGKLKEHLGSAVDVAEYKDEELLTESEENDSEEGSEEMYKVEAEEENA 670 680 690 700 710 720 730 pF1KSD DKSKAAPAEIDQR ::::::::::::: CCDS23 DKSKAAPAEIDQR 730 >>CCDS2631.1 SATB1 gene_id:6304|Hs108|chr3 (763 aa) initn: 2339 init1: 1042 opt: 2371 Z-score: 1815.8 bits: 346.7 E(32554): 8.1e-95 Smith-Waterman score: 2873; 62.1% identity (80.4% similar) in 760 aa overlap (1-718:1-748) 10 20 30 40 50 pF1KSD MERRSESPCLRDSPDRRSGSPDVKGPPPVKVARLEQNGSPMGARGRPNGAVAKAVG---- :.. .:. .. . .. : :::: .:.:::::::::.: ::: ... :: : CCDS26 MDHLNEATQGKEHSEMSNNVSDPKGPP-AKIARLEQNGSPLG-RGRLGSTGAKMQGVPLK 10 20 30 40 50 60 70 80 90 100 pF1KSD ------------GLMIPVFCVVEQLDGSLEYDNREEHAEFVLVRKDVLFSQLVETALLAL : :.:::::::. ....::: .::::::::::::.::.::.: :::.: CCDS26 HSGHLMKTNLRKGTMLPVFCVVEHYENAIEYDCKEEHAEFVLVRKDMLFNQLIEMALLSL 60 70 80 90 100 110 110 120 130 140 150 160 pF1KSD GYSHSSAAQAQGIIKLGRWNPLPLSYVTDAPDATVADMLQDVYHVVTLKIQLQSCSKLED ::::::::::.:.:..:.:::.::::::::::::::::::::::::::::::.:: :::: CCDS26 GYSHSSAAQAKGLIQVGKWNPVPLSYVTDAPDATVADMLQDVYHVVTLKIQLHSCPKLED 120 130 140 150 160 170 170 180 190 200 210 220 pF1KSD LPAEQWNHATVRNALKELLKEMNQSTLAKECPLSQSMISSIVNSTYYANVSATKCQEFGR :: :::.:.:::::::.:::.::::.::::::::::::::::::::::::::.::::::: CCDS26 LPPEQWSHTTVRNALKDLLKDMNQSSLAKECPLSQSMISSIVNSTYYANVSAAKCQEFGR 180 190 200 210 220 230 230 240 250 260 270 280 pF1KSD WYKKYKKIKVERVERENLSDYCVLGQRPMHLPNMNQLASLGKTNEQSPH-SQIHH-STP- :::..:: : :: ..::. :.:. . :..: :.: :: : .:. : : : CCDS26 WYKHFKKTKDMMVEMDSLSE---LSQQGANHVNFGQQPVPGNTAEQPPSPAQLSHGSQPS 240 250 260 270 280 290 290 300 310 320 330 340 pF1KSD IRNQVPALQPIMSPGLLSPQLSPQLVRQQIAMAHLINQQIAVSRLLAHQHPQAINQQFLN .:. .: :.: ::.: .::::: ::..::.:.::: ::.::::.: ..:::.:: CCDS26 VRTPLPNLHP----GLVSTPISPQLVNQQLVMAQLLNQQYAVNRLLAQQ---SLNQQYLN 300 310 320 330 340 350 360 370 380 390 pF1KSD HPP-IPRAV-KP--EPTNSSVEVSPDIYQQVRDELKRASVSQAVFARVAFNRTQGLLSEI ::: . :.. :: . .....::: .::: ::::::::..:::::::::::::::::::: CCDS26 HPPPVSRSMNKPLEQQVSTNTEVSSEIYQWVRDELKRAGISQAVFARVAFNRTQGLLSEI 350 360 370 380 390 400 400 410 420 430 440 450 pF1KSD LRKEEDPRTASQSLLVNLRAMQNFLNLPEVERDRIYQDERERSMNPNVSMVSSASSSPSS :::::::.:::::::::::::::::.:::.:::::::::::::.: .: . : CCDS26 LRKEEDPKTASQSLLVNLRAMQNFLQLPEAERDRIYQDERERSLNAASAMGPAPLISTPP 410 420 430 440 450 460 460 470 480 490 500 510 pF1KSD SRTPQAKTSTPTTDLPIKVDGANINITAAIYDEIQQEMKRAKVSQALFAKVAANKSQGWL :: ::.::.: .:. : .. ..::.:.::::::::::::::::::::::::.:::::: CCDS26 SRPPQVKTATIATERNGKPENNTMNINASIYDEIQQEMKRAKVSQALFAKVAATKSQGWL 470 480 490 500 510 520 520 530 540 550 560 570 pF1KSD CELLRWKENPSPENRTLWENLCTIRRFLNLPQHERDVIYEEESR--HHHSERMQHVVQLP ::::::::.:::::::::::: :::::.::: :::.:::.:: :::..: :....: CCDS26 CELLRWKEDPSPENRTLWENLSMIRRFLSLPQPERDAIYEQESNAVHHHGDRPPHIIHVP 530 540 550 560 570 580 580 590 600 610 pF1KSD PEPVQVLHRQQSQPAKESS---PPREEAPP---P--PP--PTEDSCA-------KKPRSR : .: ..::.: .... ::. . : : :: :: : : .: : : CCDS26 AEQIQQQQQQQQQQQQQQQAPPPPQPQQQPQTGPRLPPRQPTVASPAESDEENRQKTRPR 590 600 610 620 630 640 620 630 640 650 660 670 pF1KSD TKISLEALGILQSFIHDVGLYPDQEAIHTLSAQLDLPKHTIIKFFQNQRYHVKHHGKLKE ::::.::::::::::.:::::::.:::.::::::::::.:::::::::::..:::::::. CCDS26 TKISVEALGILQSFIQDVGLYPDEEAIQTLSAQLDLPKYTIIKFFQNQRYYLKHHGKLKD 650 660 670 680 690 700 680 690 700 710 720 730 pF1KSD HLGSAVDVAEYKDEELLTESEENDSEEGSEEMYKVEAEEENADKSKAAPAEIDQR . : :::::::.:::: . ::. ...... ...:. ::: CCDS26 NSGLEVDVAEYKEEELLKDLEESVQDKNTNTLFSVKLEEELSVEGNTDINTDLKD 710 720 730 740 750 760 >>CCDS56242.1 SATB1 gene_id:6304|Hs108|chr3 (795 aa) initn: 2744 init1: 1042 opt: 2312 Z-score: 1770.5 bits: 338.3 E(32554): 2.7e-92 Smith-Waterman score: 2820; 59.4% identity (77.4% similar) in 791 aa overlap (1-717:1-779) 10 20 30 40 50 pF1KSD MERRSESPCLRDSPDRRSGSPDVKGPPPVKVARLEQNGSPMGARGRPNGAVAKAVG---- :.. .:. .. . .. : :::: .:.:::::::::.: ::: ... :: : CCDS56 MDHLNEATQGKEHSEMSNNVSDPKGPP-AKIARLEQNGSPLG-RGRLGSTGAKMQGVPLK 10 20 30 40 50 60 70 80 90 100 pF1KSD ------------GLMIPVFCVVEQLDGSLEYDNREEHAEFVLVRKDVLFSQLVETALLAL : :.:::::::. ....::: .::::::::::::.::.::.: :::.: CCDS56 HSGHLMKTNLRKGTMLPVFCVVEHYENAIEYDCKEEHAEFVLVRKDMLFNQLIEMALLSL 60 70 80 90 100 110 110 120 130 140 150 160 pF1KSD GYSHSSAAQAQGIIKLGRWNPLPLSYVTDAPDATVADMLQDVYHVVTLKIQLQSCSKLED ::::::::::.:.:..:.:::.::::::::::::::::::::::::::::::.:: :::: CCDS56 GYSHSSAAQAKGLIQVGKWNPVPLSYVTDAPDATVADMLQDVYHVVTLKIQLHSCPKLED 120 130 140 150 160 170 170 180 190 200 210 220 pF1KSD LPAEQWNHATVRNALKELLKEMNQSTLAKECPLSQSMISSIVNSTYYANVSATKCQEFGR :: :::.:.:::::::.:::.::::.::::::::::::::::::::::::::.::::::: CCDS56 LPPEQWSHTTVRNALKDLLKDMNQSSLAKECPLSQSMISSIVNSTYYANVSAAKCQEFGR 180 190 200 210 220 230 230 240 250 260 270 280 pF1KSD WYKKYKKIKVERVERENLSDYCVLGQRPMHLPNMNQLASLGKTNEQSPH-SQIHH-STP- :::..:: : :: ..::. :.:. . :..: :.: :: : .:. : : : CCDS56 WYKHFKKTKDMMVEMDSLSE---LSQQGANHVNFGQQPVPGNTAEQPPSPAQLSHGSQPS 240 250 260 270 280 290 290 300 310 320 330 340 pF1KSD IRNQVPALQPIMSPGLLSPQLSPQLVRQQIAMAHLINQQIAVSRLLAHQHPQAINQQFLN .:. .: :.: ::.: .::::: ::..::.:.::: ::.::::. :..:::.:: CCDS56 VRTPLPNLHP----GLVSTPISPQLVNQQLVMAQLLNQQYAVNRLLAQ---QSLNQQYLN 300 310 320 330 340 350 360 370 380 390 pF1KSD HPP-IPRAV-KP--EPTNSSVEVSPDIYQQVRDELKRASVSQAVFARVAFNRTQGLLSEI ::: . :.. :: . .....::: .::: ::::::::..:::::::::::::::::::: CCDS56 HPPPVSRSMNKPLEQQVSTNTEVSSEIYQWVRDELKRAGISQAVFARVAFNRTQGLLSEI 350 360 370 380 390 400 400 410 420 430 440 450 pF1KSD LRKEEDPRTASQSLLVNLRAMQNFLNLPEVERDRIYQDERERSMNPNVSMVSSASSSPSS :::::::.:::::::::::::::::.:::.:::::::::::::.: .: . : CCDS56 LRKEEDPKTASQSLLVNLRAMQNFLQLPEAERDRIYQDERERSLNAASAMGPAPLISTPP 410 420 430 440 450 460 460 470 480 490 500 510 pF1KSD SRTPQAKTSTPTTDLPIKVDGANINITAAIYDEIQQEMKRAKVSQALFAKVAANKSQGWL :: ::.::.: .:. : .. ..::.:.::::::::::::::::::::::::.:::::: CCDS56 SRPPQVKTATIATERNGKPENNTMNINASIYDEIQQEMKRAKVSQALFAKVAATKSQGWL 470 480 490 500 510 520 520 530 540 550 560 570 pF1KSD CELLRWKENPSPENRTLWENLCTIRRFLNLPQHERDVIYEEESR--HHHSERMQHVVQLP ::::::::.:::::::::::: :::::.::: :::.:::.:: :::..: :....: CCDS56 CELLRWKEDPSPENRTLWENLSMIRRFLSLPQPERDAIYEQESNAVHHHGDRPPHIIHVP 530 540 550 560 570 580 580 590 600 pF1KSD PEPVQ-----VLHR----------------------QQSQPAKESSPPREEAPPPP---- : .: .: . ::.: .... ...::::: CCDS56 AEQIQSPSPTTLGKGESRGVFLPGLPTPAPWLGAAPQQQQQQQQQQQQQQQAPPPPQPQQ 590 600 610 620 630 640 610 620 630 640 pF1KSD --------PPTEDSCA----------KKPRSRTKISLEALGILQSFIHDVGLYPDQEAIH :: . . : .: : :::::.::::::::::.:::::::.:::. CCDS56 QPQTGPRLPPRQPTVASPAESDEENRQKTRPRTKISVEALGILQSFIQDVGLYPDEEAIQ 650 660 670 680 690 700 650 660 670 680 690 700 pF1KSD TLSAQLDLPKHTIIKFFQNQRYHVKHHGKLKEHLGSAVDVAEYKDEELLTESEENDSEEG ::::::::::.:::::::::::..:::::::.. : :::::::.:::: . ::. .... CCDS56 TLSAQLDLPKYTIIKFFQNQRYYLKHHGKLKDNSGLEVDVAEYKEEELLKDLEESVQDKN 710 720 730 740 750 760 710 720 730 pF1KSD SEEMYKVEAEEENADKSKAAPAEIDQR .. ...:. :: CCDS56 TNTLFSVKLEEELSVEGNTDINTDLKD 770 780 790 733 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 04:41:08 2016 done: Thu Nov 3 04:41:09 2016 Total Scan time: 3.780 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]