FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA0360, 1007 aa 1>>>pF1KSDA0360 1007 - 1007 aa - 1007 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 13.9345+/-0.00106; mu= -14.0248+/- 0.063 mean_var=722.6801+/-174.558, 0's: 0 Z-trim(117.3): 59 B-trim: 0 in 0/53 Lambda= 0.047709 statistics sampled from 17975 (18024) to 17975 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.804), E-opt: 0.2 (0.554), width: 16 Scan time: 6.200 The best scores are: opt bits E(32554) CCDS32045.1 SALL2 gene_id:6297|Hs108|chr14 (1007) 6810 484.7 4.1e-136 CCDS76656.1 SALL2 gene_id:6297|Hs108|chr14 ( 906) 4729 341.4 5e-93 CCDS12013.1 SALL3 gene_id:27164|Hs108|chr18 (1300) 1173 96.8 3e-19 CCDS45483.1 SALL1 gene_id:6299|Hs108|chr16 (1227) 1128 93.7 2.5e-18 CCDS10747.1 SALL1 gene_id:6299|Hs108|chr16 (1324) 1128 93.7 2.6e-18 >>CCDS32045.1 SALL2 gene_id:6297|Hs108|chr14 (1007 aa) initn: 6810 init1: 6810 opt: 6810 Z-score: 2557.2 bits: 484.7 E(32554): 4.1e-136 Smith-Waterman score: 6810; 99.9% identity (99.9% similar) in 1007 aa overlap (1-1007:1-1007) 10 20 30 40 50 60 pF1KSD MSRRKQRKPQQLISDCEGPSASENGDASEEDHPQVCAKCCAQFTDPTEFLAHQNACSTDP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 MSRRKQRKPQQLISDCEGPSASENGDASEEDHPQVCAKCCAQFTDPTEFLAHQNACSTDP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD PVMVIIGGQENPNNSSASSEPRPEGHNNPQVMDTEHSNPPDSGSSVPTDPTWGPERRGEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 PVMVIIGGQENPNNSSASSEPRPEGHNNPQVMDTEHSNPPDSGSSVPTDPTWGPERRGEE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD SSGHFLVAATGTAAGGGGGLILASPKLGATPLPPESTPAPPPPPPPPPPPGVGSGHLNIP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 SSGHFLVAATGTAAGGGGGLILASPKLGATPLPPESTPAPPPPPPPPPPPGVGSGHLNIP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD LILEELRVLQQRQIHQMQMTEQICRQVLLLGSLGQTVGAPASPSELPGTGTASSTKPLLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LILEELRVLQQRQIHQMQMTEQICRQVLLLGSLGQTVGAPASPSELPGTGTASSTKPLLP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD LFSPIKPVQTSKTLASSSSSSSSSSGAETPKQAFFHLYHPLGSQHPFSAGGVGRSHKPTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LFSPIKPVQTSKTLASSSSSSSSSSGAETPKQAFFHLYHPLGSQHPFSAGGVGRSHKPTP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD APSPALPGSTDQLIASPHLAFPSTTGLLAAQCLGAARGLEATASPGLLKPKNGSGELSYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 APSPALPGSTDQLIASPHLAFPSTTGLLAAQCLGAARGLEATASPGLLKPKNGSGELSYG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD EVMGPLEKPGGRHKCRFCAKVFGSDSALQIHLRSHTGERPYKCNVCGNRFTTRGNLKVHF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 EVMGPLEKPGGRHKCRFCAKVFGSDSALQIHLRSHTGERPYKCNVCGNRFTTRGNLKVHF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD HRHREKYPHVQMNPHPVPEHLDYVITSSGLPYGMSVPPEKAEEEAATPGGGVERKPLVAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 HRHREKYPHVQMNPHPVPEHLDYVITSSGLPYGMSVPPEKAEEEAATPGGGVERKPLVAS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD TTALSATESLTLLSTSAGTATAPGLPAFNKFVLMKAVEPKNKADENTPPGSEGSAISGVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 TTALSATESLTLLSTSAGTATAPGLPAFNKFVLMKAVEPKNKADENTPPGSEGSAISGVA 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD ESSTATRMQLSKLVTSLPSWALLTNHFKSTGSFPFPYVLEPLGASPSETSKLQQLVEKID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 ESSTATRMQLSKLVTSLPSWALLTNHFKSTGSFPFPYVLEPLGASPSETSKLQQLVEKID 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD RQGAVAVTSAASGAPTTSAPAPSSSASSGPNQCVICLRVLSCPRALRLHYGQHGGERPFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 RQGAVAVTSAASGAPTTSAPAPSSSASSGPNQCVICLRVLSCPRALRLHYGQHGGERPFK 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD CKVCGRAFSTRGNLRAHFVGHKASPAARAQNSCPICQKKFTNAVTLQQHVRMHLGGQIPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 CKVCGRAFSTRGNLRAHFVGHKASPAARAQNSCPICQKKFTNAVTLQQHVRMHLGGQIPN 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD GGTALPEGGGAAQENGSEQSTVSGAGSFPQQQSQQPSPEEELSEEEEEEDEEEEEDVTDE ::::::::::::::::::::::::: :::::::::::::::::::::::::::::::::: CCDS32 GGTALPEGGGAAQENGSEQSTVSGARSFPQQQSQQPSPEEELSEEEEEEDEEEEEDVTDE 730 740 750 760 770 780 790 800 810 820 830 840 pF1KSD DSLAGRGSESGGEKAISVRGDSEEASGAEEEVGTVAAAATAGKEMDSNEKTTQQSSLPPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 DSLAGRGSESGGEKAISVRGDSEEASGAEEEVGTVAAAATAGKEMDSNEKTTQQSSLPPP 790 800 810 820 830 840 850 860 870 880 890 900 pF1KSD PPPDSLDQPQPMEQGSSGVLGGKEEGGKPERSSSPASALTPEGEATSVTLVEELSLQEAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 PPPDSLDQPQPMEQGSSGVLGGKEEGGKPERSSSPASALTPEGEATSVTLVEELSLQEAM 850 860 870 880 890 900 910 920 930 940 950 960 pF1KSD RKEPGESSSRKACEVCGQAFPSQAALEEHQKTHPKEGPLFTCVFCRQGFLERATLKKHML :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 RKEPGESSSRKACEVCGQAFPSQAALEEHQKTHPKEGPLFTCVFCRQGFLERATLKKHML 910 920 930 940 950 960 970 980 990 1000 pF1KSD LAHHQVQPFAPHGPQNIAALSLVPGCSPSITSTGLSPFPRKDDPTIP ::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LAHHQVQPFAPHGPQNIAALSLVPGCSPSITSTGLSPFPRKDDPTIP 970 980 990 1000 >>CCDS76656.1 SALL2 gene_id:6297|Hs108|chr14 (906 aa) initn: 5827 init1: 4697 opt: 4729 Z-score: 1783.7 bits: 341.4 E(32554): 5e-93 Smith-Waterman score: 5208; 81.3% identity (83.0% similar) in 1013 aa overlap (1-1006:1-875) 10 20 30 40 50 60 pF1KSD MSRRKQRKPQQLISDCEGPSASENGDASEEDHPQVCAKCCAQFTDPTEFLAHQNACSTDP :.....:. ..: : : : .:::::::::::::::::::::::::::::::::::: CCDS76 MAHESERS-SRLGVPC-GEPAELGGDASEEDHPQVCAKCCAQFTDPTEFLAHQNACSTDP 10 20 30 40 50 70 80 90 100 110 120 pF1KSD PVMVIIGGQENPNNSSASSEPRPEGHNNPQVMDTEHSNPPDSGSSVPTDPTWGPERRGEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 PVMVIIGGQENPNNSSASSEPRPEGHNNPQVMDTEHSNPPDSGSSVPTDPTWGPERRGEE 60 70 80 90 100 110 130 140 150 160 170 180 pF1KSD SSGHFLVAATGTAAGGGGGLILASPKLGATPLPPESTPAPPPPPPPPPPPGVGSGHLNIP ::::::::::: CCDS76 SSGHFLVAATG------------------------------------------------- 120 190 200 210 220 230 240 pF1KSD LILEELRVLQQRQIHQMQMTEQICRQVLLLGSLGQTVGAPASPSELPGTGTASSTKPLLP CCDS76 ------------------------------------------------------------ 250 260 270 280 290 300 pF1KSD LFSPIKPVQTSKTLASSSSSSSSSSGAETPKQAFFHLYHPLGSQHPFSAGGVGRSHKPTP :::::::::::::::::::::::::::::::::: CCDS76 --------------------------AETPKQAFFHLYHPLGSQHPFSAGGVGRSHKPTP 130 140 150 160 310 320 330 340 350 360 pF1KSD APSPALPGSTDQLIASPHLAFPSTTGLLAAQCLGAARGLEATASPGLLKPKNGSGELSYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 APSPALPGSTDQLIASPHLAFPSTTGLLAAQCLGAARGLEATASPGLLKPKNGSGELSYG 170 180 190 200 210 220 370 380 390 400 410 420 pF1KSD EVMGPLEKPGGRHKCRFCAKVFGSDSALQIHLRSHTGERPYKCNVCGNRFTTRGNLKVHF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 EVMGPLEKPGGRHKCRFCAKVFGSDSALQIHLRSHTGERPYKCNVCGNRFTTRGNLKVHF 230 240 250 260 270 280 430 440 450 460 470 480 pF1KSD HRHREKYPHVQMNPHPVPEHLDYVITSSGLPYGMSVPPEKAEEEAATPGGGVERKPLVAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 HRHREKYPHVQMNPHPVPEHLDYVITSSGLPYGMSVPPEKAEEEAATPGGGVERKPLVAS 290 300 310 320 330 340 490 500 510 520 530 540 pF1KSD TTALSATESLTLLSTSAGTATAPGLPAFNKFVLMKAVEPKNKADENTPPGSEGSAISGVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 TTALSATESLTLLSTSAGTATAPGLPAFNKFVLMKAVEPKNKADENTPPGSEGSAISGVA 350 360 370 380 390 400 550 560 570 580 590 600 pF1KSD ESSTATRMQLSKLVTSLPSWALLTNHFKSTGSFPFPYVLEPLGASPSETSKLQQLVEKID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 ESSTATRMQLSKLVTSLPSWALLTNHFKSTGSFPFPYVLEPLGASPSETSKLQQLVEKID 410 420 430 440 450 460 610 620 630 640 650 660 pF1KSD RQGAVAVTSAASGAPTTSAPAPSSSASSGPNQCVICLRVLSCPRALRLHYGQHGGERPFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 RQGAVAVTSAASGAPTTSAPAPSSSASSGPNQCVICLRVLSCPRALRLHYGQHGGERPFK 470 480 490 500 510 520 670 680 690 700 710 720 pF1KSD CKVCGRAFSTRGNLRAHFVGHKASPAARAQNSCPICQKKFTNAVTLQQHVRMHLGGQIPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 CKVCGRAFSTRGNLRAHFVGHKASPAARAQNSCPICQKKFTNAVTLQQHVRMHLGGQIPN 530 540 550 560 570 580 730 740 750 760 770 780 pF1KSD GGTALPEGGGAAQENGSEQSTVSGAGSFPQQQSQQPSPEEELSEEEEEEDEEEEEDVTDE ::::::::::::::::::::::::: :::::::::::::::::::::::::::::::::: CCDS76 GGTALPEGGGAAQENGSEQSTVSGARSFPQQQSQQPSPEEELSEEEEEEDEEEEEDVTDE 590 600 610 620 630 640 790 800 810 820 830 840 pF1KSD DSLAGRGSESGGEKAISVRGDSEEASGAEEEVGTVAAAATAGKEMDSNEKTTQQSSLPPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 DSLAGRGSESGGEKAISVRGDSEEASGAEEEVGTVAAAATAGKEMDSNEKTTQQSSLPPP 650 660 670 680 690 700 850 860 870 880 890 900 pF1KSD PPPDSLDQPQPMEQGSSGVLGGKEEGGKPERSSSPASALTPEGEATSVTLVEELSLQEAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 PPPDSLDQPQPMEQGSSGVLGGKEEGGKPERSSSPASALTPEGEATSVTLVEELSLQEAM 710 720 730 740 750 760 910 920 930 940 950 960 pF1KSD RKEPGESSSRKACEVCGQAFPSQAALEEHQKTHPKEGPLFTCVFCRQGFLERATLKKHML :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 RKEPGESSSRKACEVCGQAFPSQAALEEHQKTHPKEGPLFTCVFCRQGFLERATLKKHML 770 780 790 800 810 820 970 980 990 1000 pF1KSD LAHHQVQPFA------PHGPQNIAALSLV-PGCSPSITSTGLSPFPRKDDPTIP ::::: : : : : : .. : . :. .: . ::. : ::. CCDS76 LAHHQNQYVAFLSNGLPMKPWNSSSTSTTTPSLAPPVL-FGLGTVAGKVPPTMGSREAKE 830 840 850 860 870 880 CCDS76 KTAPLLFQPPAPKAVPEKPIIDKK 890 900 >>CCDS12013.1 SALL3 gene_id:27164|Hs108|chr18 (1300 aa) initn: 1321 init1: 575 opt: 1173 Z-score: 459.0 bits: 96.8 E(32554): 3e-19 Smith-Waterman score: 1646; 34.4% identity (54.9% similar) in 1109 aa overlap (17-990:32-1060) 10 20 30 40 pF1KSD MSRRKQRKPQQLISDCEGPSASENGDASEE--DHPQVCAKCCAQFT :: ...: :. .. .:: ::::.: CCDS12 SRRKQAKPQHLKSDEELLPPDGAPEHAAPGEGAEDADSGPESRSGGEETSVCEKCCAEFF 10 20 30 40 50 60 50 60 70 80 90 100 pF1KSD DPTEFLAHQNACSTDPPVMVIIGGQENPNNSSASSEPRPEGHNNPQVMDTEHSNPPDSGS ..:: :: .:. :::... .. : : :: .: .: .: CCDS12 KWADFLEHQRSCTKLPPVLIV--HEDAPA-------PPPEDFPEP--------SPASS-- 70 80 90 100 110 120 130 140 150 160 pF1KSD SVPTDPTWGPERRGEESSGHFLVAATGTAAGGGGGLILASPKLGATPLPPESTPAPPPPP :. : .. : .: : : : : . . . . : : .: ::: CCDS12 -----PSERAESEAAEEAG-----AEG-AEGEARPVEKEAEPMDAEPAGDTRAPRPPPAA 110 120 130 140 150 170 180 pF1KSD PPPPPPGVGSGHLNI------------------------------------PLILEELRV : :: :. :. :. :::::.: . CCDS12 PAPPTPAYGAPSTNVTLEALLSTKVAVAQFSQGARAAGGSGAGGGVAAAAVPLILEQLMA 160 170 180 190 200 210 190 200 210 220 230 pF1KSD LQQRQIHQMQMTEQICRQVLLLG------SLGQTVG--APA-SPSELPGTG----TASST :::.::::.:. ::: :: :. ::. ... ::. .::.::: . .:.. CCDS12 LQQQQIHQLQLIEQIRSQVALMQRPPPRPSLSPAAAPSAPGPAPSQLPGLAALPLSAGAP 220 230 240 250 260 270 240 250 260 270 280 290 pF1KSD KPLLPLFSPIKPV--QTSKTLASSSSSSSSSSGAETPKQAFFHLYHPL-GSQHPFSAGGV . .: :. . .. :. :..:. .: :. : .. : : CCDS12 AAAIAGSGPAAPAAFEGAQPLSRPESGASTPGGPAEPSAPAAPSAAPAPAAPAPAPAPQS 280 290 300 310 320 330 300 310 320 330 340 pF1KSD GRSHKPTPAPSP-AL-PGSTDQLIASPHLAFP-----STTGLLAAQCLGAARGLEATASP . : .: : .: :: ::: : :.: : : :..:.. . : . . . .: CCDS12 AASSQPQSASTPPALAPGSL--LGAAPGLPSPLLPQTSASGVIFPNPLVSIAATANALDP 340 350 360 370 380 350 360 370 380 390 400 pF1KSD --GLLKPKNGSG-ELSYGEVMGPLEKPGGRHKCRFCAKVFGSDSALQIHLRSHTGERPYK .:.: ..:. ..: : . : : .::::::::::::::::::::::::::::.: CCDS12 LSALMKHRKGKPPNVSVFEPKASAEDPFFKHKCRFCAKVFGSDSALQIHLRSHTGERPFK 390 400 410 420 430 440 410 420 430 440 450 460 pF1KSD CNVCGNRFTTRGNLKVHFHRHREKYPHVQMNPHPVPEHLDYVITSSGLPYGMSVPPEKA- ::.:::::.:.:::::::.::.:::::.::::.::::.:: : : ::.:::::.:::: CCDS12 CNICGNRFSTKGNLKVHFQRHKEKYPHIQMNPYPVPEYLDNVPTCSGIPYGMSLPPEKPV 450 460 470 480 490 500 470 480 490 500 pF1KSD ----EEEAATP----GGGVERKPLVASTTALSATESLTLLSTS------AGTATA---PG . . . : . :.. : : .. . . . : : : : :.. : :: CCDS12 TTWLDSKPVLPTVPTSVGLQLPPTVPGAHGYADSPSATPASRSPQRPSPASSECASLSPG 510 520 530 540 550 560 510 520 530 540 550 pF1KSD LPAFNKFVLMKAVEPKN--------KADENTPPGSE---GSAISGVAESSTATRMQLSKL : .. : : :.. ::. . : .. :.: :. :.. : .. . CCDS12 LNHVESGVSATAESPQSLLGGPPLTKAEPVSLPCTNARAGDAPVGAQASAAPTSVDGAPT 570 580 590 600 610 620 560 570 580 590 600 610 pF1KSD VTSLPSWALLTNHFKSTGSFPFPYVLEPLGASPSETSKLQQLVEKIDRQGAVAVTSAASG . :. ....::. .::: .:. . . :::::::::::.::.. CCDS12 SLGSPGLPAVSEQFKA--QFPFGGLLDSM--QTSETSKLQQLVENIDKK----------- 630 640 650 660 670 620 630 640 650 660 670 pF1KSD APTTSAPAPSSSASSGPNQCVICLRVLSCPRALRLHYGQHGGERPFKCKVCGRAFSTRGN . ::::::: ::::: ::..:: : ::::::::.:::::.:.:: CCDS12 -------------MTDPNQCVICHRVLSCQSALKMHYRTHTGERPFKCKICGRAFTTKGN 680 690 700 710 720 680 690 700 710 720 730 pF1KSD LRAHFVGHKASPAARAQNSCPICQKKFTNAVTLQQHVRMHLGGQIPNGGTALPEGGGAAQ :..:: :.:.: :.:.:::::::::::::.::::.:::.:::::: : :::: :. CCDS12 LKTHFGVHRAKPPLRVQHSCPICQKKFTNAVVLQQHIRMHMGGQIPN--TPLPEGFQDAM 730 740 750 760 770 740 750 760 pF1KSD ----------------------ENGSEQST-VSGAGSFPQQQ------SQQPSPEEELSE ::. :... .. :.. : . : ::: .: CCDS12 DSELAYDDKNAETLSSYDDDMDENSMEDDAELKDAATDPAKPLLSYAGSCPPSPPSVISS 780 790 800 810 820 830 770 780 790 800 810 820 pF1KSD EEEEEDEEEEED-VTDEDSLAG-RGSESGGEKAISVRGDSEEASGAEEEVGTVAAAATAG :.. . : : . ..:.: .. :.:. .. . .:: : : : . .:: CCDS12 IAALENQMKMIDSVMSCQQLTGLKSVENGSGESDRLSNDSSSAVGDLE-------SRSAG 840 850 860 870 880 890 830 840 850 860 870 pF1KSD KEMDSNEKTTQQSSLPPPPPPDSLDQPQPMEQGSSGVLGGKEEGG----KPERSSSPASA . : :....:. : : .:. . .: : ::. :: : :: .:::.: CCDS12 SPALS-ESSSSQALSPAPSNGESFRSKSP---G----LGAPEEPQEIPLKTERPDSPAAA 900 910 920 930 940 880 890 900 910 920 930 pF1KSD LTPEGEATSVTLVEELSLQEA-MRKEPGESSSRKACEVCGQAFPSQAALEEHQKTHPKEG : . . :: .. . .: :. : .: :::. : ..::: : ..: :: CCDS12 PGSGGAPGRAGIKEEAPFSLLFLSRERGKCPST-VCGVCGKPFACKSALEIHYRSHTKER 950 960 970 980 990 1000 940 950 960 970 980 990 pF1KSD PLFTCVFCRQGFLERATLKKHMLLAHHQVQP---FAPH---GPQNIAALSLVPGCSPSIT : :.:..::.: ..::.:.: . . : : :. ::.. .. ::. . .:.. CCDS12 P-FVCALCRRGCSTMGNLKQHLLTHRLKELPSQLFDPNFALGPSQ-STPSLISSAAPTMI 1010 1020 1030 1040 1050 1060 1000 pF1KSD STGLSPFPRKDDPTIP CCDS12 KMEVNGHGKAMALGEGPPLPAGVQVPAGPQTVMGPGLAPMLAPPPRRTPKQHNCQSCGKT 1070 1080 1090 1100 1110 1120 >>CCDS45483.1 SALL1 gene_id:6299|Hs108|chr16 (1227 aa) initn: 1321 init1: 588 opt: 1128 Z-score: 442.6 bits: 93.7 E(32554): 2.5e-18 Smith-Waterman score: 1487; 35.3% identity (60.2% similar) in 937 aa overlap (171-1005:121-1008) 150 160 170 180 190 200 pF1KSD ILASPKLGATPLPPESTPAPPPPPPPPPPPGVGSGHLNIPLILEELRVLQQRQIHQMQMT :...:.: .: ..:.: .:::.::::.:. CCDS45 FSVINSNVIIENLQSTKVAVAQFSQEARCGGASGGKLAVPALMEQLLALQQQQIHQLQLI 100 110 120 130 140 150 210 220 230 240 250 pF1KSD EQICRQVLLLGSLGQTVGAPASPSELPGTGTA-SSTKPLLPLFSPI-KPVQTSKTLASSS ::: .:.:::.: :.. :.: : :. :: .:..:: : : . . . .. ::.: CCDS45 EQIRHQILLLAS--QNADLPTSSS--PSQGTLRTSANPLSTLSSHLSQQLAAAAGLAQSL 160 170 180 190 200 260 270 280 290 pF1KSD SSSSSS-SGA------ETPKQAFFHLYHPLGSQH-------------PFS---AGGVGRS .:.:.: ::. . :... . : .: : : :...: : CCDS45 ASQSASISGVKQLPPIQLPQSSSGNTIIPSNSGSSPNMNILAAAVTTPSSEKVASSAGAS 210 220 230 240 250 260 300 310 320 330 340 pF1KSD HKPTPA----PSPAL-------PGSTDQLI--ASPHLAFPSTTGLLAAQCLGAARGLEAT : .:: :::. :.:. : :: . .::: ... .: : CCDS45 HVSNPAVSSSSSPAFAISSLLSPASNPLLPQQASANSVFPSPLPNIGTTAEDLN-SLSAL 270 280 290 300 310 320 350 360 370 380 390 400 pF1KSD ASPGLLKPKNGSGELSYGEVMGPLEKPGGRHKCRFCAKVFGSDSALQIHLRSHTGERPYK :. :: : .. :. . .. .::::::::::::::::::::::::::::.: CCDS45 AQQRKSKPPN----VTAFEAKSTSDEAFFKHKCRFCAKVFGSDSALQIHLRSHTGERPFK 330 340 350 360 370 380 410 420 430 440 450 460 pF1KSD CNVCGNRFTTRGNLKVHFHRHREKYPHVQMNPHPVPEHLDYVITSSGLPYGMSVPPEKA- ::.:::::.:.:::::::.::.:::::.::::.::::::: . ::.:.:::::.:::: CCDS45 CNICGNRFSTKGNLKVHFQRHKEKYPHIQMNPYPVPEHLDNIPTSTGIPYGMSIPPEKPV 390 400 410 420 430 440 470 480 490 500 510 pF1KSD ----EEEAATP----GGGVERKPLVASTTALSATESLTLLSTSAGTATAPGLPAFNKFVL . . . : . :. : . : . :: . . : .... :: .. CCDS45 TSWLDTKPVLPTLTTSVGLPLPPTLPSLIPFIKTEEPAPIPISHSATSPPGSVKSDSGGP 450 460 470 480 490 500 520 530 540 550 pF1KSD MKAVE-----PKNKADENTPPGSEGSAISGVAESS--TATRMQLSK---------LVTSL .:.. :.. . ::.. : ::.. .: ::. ::. .:.. CCDS45 ESATRNLGGLPEEAEGSTLPPSGGKSEESGMVTNSVPTASSSVLSSPAADCGPAGSATTF 510 520 530 540 550 560 560 570 580 590 600 610 pF1KSD --PSWALLTNHFKSTGSFPFPYVLEPLGASPSETSKLQQLVEKIDRQGAVAVTSAASGAP : :....::. .::: .:. .:. :::::::::::.::.. CCDS45 TNPLLPLMSEQFKA--KFPFGGLLD--SAQASETSKLQQLVENIDKK------------- 570 580 590 600 620 630 640 650 660 670 pF1KSD TTSAPAPSSSASSGPNQCVICLRVLSCPRALRLHYGQHGGERPFKCKVCGRAFSTRGNLR .. ::.:.:: ::::: ::..:: : ::::::::.:::::.:.:::. CCDS45 -----------ATDPNECIICHRVLSCQSALKMHYRTHTGERPFKCKICGRAFTTKGNLK 610 620 630 640 650 680 690 700 710 720 730 pF1KSD AHFVGHKASPAARAQNSCPICQKKFTNAVTLQQHVRMHLGGQIPNGGTALPEGGGAAQEN .:. :.: : :.:.:::::::::::::.::::.:::.:::::: : .:.. . ..:. CCDS45 THYSVHRAMPPLRVQHSCPICQKKFTNAVVLQQHIRMHMGGQIPN--TPVPDSYSESMES 660 670 680 690 700 710 740 750 760 770 780 pF1KSD --GS-EQSTVSGAGSFPQQQSQQPSPEEELSEEEEEEDEEEEEDVT-----DEDSLAGRG :: .... . .: ...... :: . . . : .. . . .:.:. CCDS45 DTGSFDEKNFDDLDNF-SDENMEDCPEGSIPDTPKSADASQDSLSSSPLPLEMSSIAALE 720 730 740 750 760 770 790 800 810 820 830 pF1KSD SE-----SGGEKAISVRGDSEEASGAEEEVGTVAAAATAGKEMDS--------NEKTTQQ .. .: . ... : : .. : .: : ....: .:.: .:.:... CCDS45 NQMKMINAGLAEQLQASLKSVENGSIEGDVLT-NDSSSVGGDMESQSAGSPAISESTSSM 780 790 800 810 820 840 850 860 870 880 890 pF1KSD SSLPPPPPPDSLDQ-PQPMEQGSSGVLGGKEEGGKPERSSSPASALTPEGEATSVTLVEE ..: : . . . :. :. . .: . .: .: .. : :: ..: .. . CCDS45 QALSPSNSTQEFHKSPSIEEKPQRAVPSEFANGLSPTPVNGGALDLTS-SHAEKIIKEDS 830 840 850 860 870 880 900 910 920 930 940 950 pF1KSD LSLQEAMRKEPGESSSRKACEVCGQAFPSQAALEEHQKTHPKEGPLFTCVFCRQGFLERA :.. .: . :. .. ::..::..: :.::. : ..: :: : : :. : .:: .. CCDS45 LGILFPFRDR-GKFKNT-ACDICGKTFACQSALDIHYRSHTKERP-FICTVCNRGFSTKG 890 900 910 920 930 940 960 970 980 990 pF1KSD TLKKHMLLAHHQV-----QPFAPH---GPQNIAALSLVPGCS-PSITST---GL---SPF .::.::: ::. : : : ::.. .: ..:. : :. .: :. :: CCDS45 NLKQHMLT--HQMRDLPSQLFEPSSNLGPNQNSA--VIPANSLSSLIKTEVNGFVHVSPQ 950 960 970 980 990 1000 1000 pF1KSD PRKDDPTIP :: :: CCDS45 DSKDTPTSHVPSGPLSSSATSPVLLPALPRRTPKQHYCNTCGKTFSSSSALQIHERTHTG 1010 1020 1030 1040 1050 1060 >>CCDS10747.1 SALL1 gene_id:6299|Hs108|chr16 (1324 aa) initn: 1321 init1: 588 opt: 1128 Z-score: 442.2 bits: 93.7 E(32554): 2.6e-18 Smith-Waterman score: 1561; 33.3% identity (57.6% similar) in 1114 aa overlap (36-1005:45-1105) 10 20 30 40 50 60 pF1KSD QRKPQQLISDCEGPSASENGDASEEDHPQVCAKCCAQFTDPTEFLAHQNACSTDPPVMVI :..:::.: . ...: :.. :. . :... CCDS10 DPEVASLPRRDGDTEKGQPSRPTKSKDAHVCGRCCAEFFELSDLLLHKKNCTKNQLVLIV 20 30 40 50 60 70 70 80 90 100 110 pF1KSD IGGQENPNNSSASSEPRPEGHN-NPQVMDT-------------EHSNPPDSGSSVPTD-P .::: . . : : : . :. :: :: : : :. .. : CCDS10 ---NENPASPPETFSPSPPPDNPDEQMNDTVNKTDQVDCSDLSEH-NGLDREESMEVEAP 80 90 100 110 120 130 120 130 140 150 pF1KSD TWGPERRGEESSGHFLVA----ATGTAAGGGGG--------LILASPKLGA-TPLPP--- . . : :..: .: .......:::: . . :.:: : : CCDS10 VANKSGSGTSSGSHSSTAPSSSSSSSSSSGGGGSSSTGTSAITTSLPQLGDLTTLGNFSV 140 150 160 170 180 190 160 170 180 190 200 pF1KSD ----------ESTP-APPPPPPPPPPPGVGSGHLNIPLILEELRVLQQRQIHQMQMTEQI .:: : :...:.: .: ..:.: .:::.::::.:. ::: CCDS10 INSNVIIENLQSTKVAVAQFSQEARCGGASGGKLAVPALMEQLLALQQQQIHQLQLIEQI 200 210 220 230 240 250 210 220 230 240 250 260 pF1KSD CRQVLLLGSLGQTVGAPASPSELPGTGTA-SSTKPLLPLFSPI-KPVQTSKTLASSSSSS .:.:::.: :.. :.: : :. :: .:..:: : : . . . .. ::.: .:. CCDS10 RHQILLLAS--QNADLPTSSS--PSQGTLRTSANPLSTLSSHLSQQLAAAAGLAQSLASQ 260 270 280 290 300 270 280 290 pF1KSD SSS-SGA------ETPKQAFFHLYHPLGSQH-------------PFS---AGGVGRSHKP :.: ::. . :... . : .: : : :...: :: CCDS10 SASISGVKQLPPIQLPQSSSGNTIIPSNSGSSPNMNILAAAVTTPSSEKVASSAGASHVS 310 320 330 340 350 360 300 310 320 330 340 pF1KSD TPA----PSPAL-------PGSTDQLI--ASPHLAFPSTTGLLAAQCLGAARGLEATASP .:: :::. :.:. : :: . .::: ... .: : :. CCDS10 NPAVSSSSSPAFAISSLLSPASNPLLPQQASANSVFPSPLPNIGTTAEDLN-SLSALAQQ 370 380 390 400 410 420 350 360 370 380 390 400 pF1KSD GLLKPKNGSGELSYGEVMGPLEKPGGRHKCRFCAKVFGSDSALQIHLRSHTGERPYKCNV :: : .. :. . .. .::::::::::::::::::::::::::::.:::. CCDS10 RKSKPPN----VTAFEAKSTSDEAFFKHKCRFCAKVFGSDSALQIHLRSHTGERPFKCNI 430 440 450 460 470 480 410 420 430 440 450 460 pF1KSD CGNRFTTRGNLKVHFHRHREKYPHVQMNPHPVPEHLDYVITSSGLPYGMSVPPEKA---- :::::.:.:::::::.::.:::::.::::.::::::: . ::.:.:::::.:::: CCDS10 CGNRFSTKGNLKVHFQRHKEKYPHIQMNPYPVPEHLDNIPTSTGIPYGMSIPPEKPVTSW 490 500 510 520 530 540 470 480 490 500 510 pF1KSD -EEEAATP----GGGVERKPLVASTTALSATESLTLLSTSAGTATAPGLPAFNKFVLMKA . . . : . :. : . : . :: . . : .... :: .. .: CCDS10 LDTKPVLPTLTTSVGLPLPPTLPSLIPFIKTEEPAPIPISHSATSPPGSVKSDSGGPESA 550 560 570 580 590 600 520 530 540 550 pF1KSD VE-----PKNKADENTPPGSEGSAISGVAESS--TATRMQLSK---------LVTSL--P .. :.. . ::.. : ::.. .: ::. ::. .:.. : CCDS10 TRNLGGLPEEAEGSTLPPSGGKSEESGMVTNSVPTASSSVLSSPAADCGPAGSATTFTNP 610 620 630 640 650 660 560 570 580 590 600 610 pF1KSD SWALLTNHFKSTGSFPFPYVLEPLGASPSETSKLQQLVEKIDRQGAVAVTSAASGAPTTS :....::. .::: .:. .:. :::::::::::.::.. CCDS10 LLPLMSEQFKA--KFPFGGLLD--SAQASETSKLQQLVENIDKK---------------- 670 680 690 700 620 630 640 650 660 670 pF1KSD APAPSSSASSGPNQCVICLRVLSCPRALRLHYGQHGGERPFKCKVCGRAFSTRGNLRAHF .. ::.:.:: ::::: ::..:: : ::::::::.:::::.:.:::..:. CCDS10 --------ATDPNECIICHRVLSCQSALKMHYRTHTGERPFKCKICGRAFTTKGNLKTHY 710 720 730 740 750 680 690 700 710 720 730 pF1KSD VGHKASPAARAQNSCPICQKKFTNAVTLQQHVRMHLGGQIPNGGTALPEGGGAAQEN--G :.: : :.:.:::::::::::::.::::.:::.:::::: : .:.. . ..:. : CCDS10 SVHRAMPPLRVQHSCPICQKKFTNAVVLQQHIRMHMGGQIPN--TPVPDSYSESMESDTG 760 770 780 790 800 810 740 750 760 770 780 pF1KSD S-EQSTVSGAGSFPQQQSQQPSPEEELSEEEEEEDEEEEEDVT-----DEDSLAGRGSE- : .... . .: ...... :: . . . : .. . . .:.:. .. CCDS10 SFDEKNFDDLDNF-SDENMEDCPEGSIPDTPKSADASQDSLSSSPLPLEMSSIAALENQM 820 830 840 850 860 870 790 800 810 820 830 pF1KSD ----SGGEKAISVRGDSEEASGAEEEVGTVAAAATAGKEMDS--------NEKTTQQSSL .: . ... : : .. : .: : ....: .:.: .:.:.....: CCDS10 KMINAGLAEQLQASLKSVENGSIEGDVLT-NDSSSVGGDMESQSAGSPAISESTSSMQAL 880 890 900 910 920 840 850 860 870 880 890 pF1KSD PPPPPPDSLDQ-PQPMEQGSSGVLGGKEEGGKPERSSSPASALTPEGEATSVTLVEELSL : . . . :. :. . .: . .: .: .. : :: ..: .. . :.. CCDS10 SPSNSTQEFHKSPSIEEKPQRAVPSEFANGLSPTPVNGGALDLTS-SHAEKIIKEDSLGI 930 940 950 960 970 980 900 910 920 930 940 950 pF1KSD QEAMRKEPGESSSRKACEVCGQAFPSQAALEEHQKTHPKEGPLFTCVFCRQGFLERATLK .: . :. .. ::..::..: :.::. : ..: :: : : :. : .:: ...:: CCDS10 LFPFRDR-GKFKNT-ACDICGKTFACQSALDIHYRSHTKERP-FICTVCNRGFSTKGNLK 990 1000 1010 1020 1030 1040 960 970 980 990 1000 pF1KSD KHMLLAHHQV-----QPFAPH---GPQNIAALSLVPGCS-PSITST---GL---SPFPRK .::: ::. : : : ::.. .: ..:. : :. .: :. :: : CCDS10 QHMLT--HQMRDLPSQLFEPSSNLGPNQNSA--VIPANSLSSLIKTEVNGFVHVSPQDSK 1050 1060 1070 1080 1090 1100 pF1KSD DDPTIP : :: CCDS10 DTPTSHVPSGPLSSSATSPVLLPALPRRTPKQHYCNTCGKTFSSSSALQIHERTHTGEKP 1110 1120 1130 1140 1150 1160 1007 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 01:24:33 2016 done: Thu Nov 3 01:24:34 2016 Total Scan time: 6.200 Total Display time: 0.240 Function used was FASTA [36.3.4 Apr, 2011]