FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1820, 1640 aa 1>>>pF1KSDA1820 1640 - 1640 aa - 1640 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 12.1911+/-0.00108; mu= -6.7906+/- 0.065 mean_var=383.0775+/-78.490, 0's: 0 Z-trim(115.0): 44 B-trim: 171 in 1/53 Lambda= 0.065529 statistics sampled from 15529 (15561) to 15529 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.766), E-opt: 0.2 (0.478), width: 16 Scan time: 5.970 The best scores are: opt bits E(32554) CCDS11188.1 RAI1 gene_id:10743|Hs108|chr17 (1906) 10906 1046.4 0 CCDS14032.1 TCF20 gene_id:6942|Hs108|chr22 (1938) 793 90.4 6.4e-17 CCDS14033.1 TCF20 gene_id:6942|Hs108|chr22 (1960) 793 90.4 6.5e-17 >>CCDS11188.1 RAI1 gene_id:10743|Hs108|chr17 (1906 aa) initn: 10906 init1: 10906 opt: 10906 Z-score: 5584.3 bits: 1046.4 E(32554): 0 Smith-Waterman score: 10906; 99.9% identity (100.0% similar) in 1598 aa overlap (1-1598:1-1598) 10 20 30 40 50 60 pF1KSD MQSFRERCGFHGKQQNYQQTSQETSRLENYRQPSQAGLSCDRQRLLAKDYYNPQPYPSYE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MQSFRERCGFHGKQQNYQQTSQETSRLENYRQPSQAGLSCDRQRLLAKDYYNPQPYPSYE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD GGAGTPSGTAAAVAADKYHRGSKALPTQQGLQGRPAFPGYGVQDSSPYPGRYAGEESLQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 GGAGTPSGTAAAVAADKYHRGSKALPTQQGLQGRPAFPGYGVQDSSPYPGRYAGEESLQA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD WGAPQPPPPQPQPLPAGVAKYDENLMKKTAVPPSRQYAEQGAQVPFRTHSLHVQQPPPPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 WGAPQPPPPQPQPLPAGVAKYDENLMKKTAVPPSRQYAEQGAQVPFRTHSLHVQQPPPPQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD QPLAYPKLQRQKLQNDIASPLPFPQGTHFPQHSQSFPTSSTYSSSVQGGGQGAHSYKSCT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 QPLAYPKLQRQKLQNDIASPLPFPQGTHFPQHSQSFPTSSTYSSSVQGGGQGAHSYKSCT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD APTAQPHDRPLTASSSLAPGQRVQNLHAYQSGRLSYDQQQQQQQQQQQQQQALQSRHHAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 APTAQPHDRPLTASSSLAPGQRVQNLHAYQSGRLSYDQQQQQQQQQQQQQQALQSRHHAQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD ETLHYQNLAKYQHYGQQGQGYCQPDAAVRTPEQYYQTFSPSSSHSPARSVGRSPSYSSTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ETLHYQNLAKYQHYGQQGQGYCQPDAAVRTPEQYYQTFSPSSSHSPARSVGRSPSYSSTP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD SPLMPNLENFPYSQQPLSTGAFPAGITDHSHFMPLLNPSPTDATSSVDTQAGNCKPLQKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SPLMPNLENFPYSQQPLSTGAFPAGITDHSHFMPLLNPSPTDATSSVDTQAGNCKPLQKD 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD KLPENLLSDLSLQSLTALTSQVENISNTVQQLLLSKAAVPQKKGVKNLVSRTPEQHKSQH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 KLPENLLSDLSLQSLTALTSQVENISNTVQQLLLSKAAVPQKKGVKNLVSRTPEQHKSQH 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD CSPEGSGYSAEPAGTPLSEPPSSTPQSTHAEPQEADYLSGSEDPLERSFLYCNQARGSPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 CSPEGSGYSAEPAGTPLSEPPSSTPQSTHAEPQEADYLSGSEDPLERSFLYCNQARGSPA 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD RVNSNSKAKPESVSTCSVTSPDDMSTKSDDSFQSLHGSLPLDSFSKFVAGERDCPRLLLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RVNSNSKAKPESVSTCSVTSPDDMSTKSDDSFQSLHGSLPLDSFSKFVAGERDCPRLLLS 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD ALAQEDLASEILGLQEAIGEKADKAWAEAPSLVKDSSKPPFSLENHSACLDSVAKSAWPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ALAQEDLASEILGLQEAIGEKADKAWAEAPSLVKDSSKPPFSLENHSACLDSVAKSAWPR 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD PGEPEALPDSLQLDKGGNAKDFSPGLFEDPSVAFATPDPKKTTGPLSFGTKPTLGVPAPD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PGEPEALPDSLQLDKGGNAKDFSPGLFEDPSVAFATPDPKKTTGPLSFGTKPTLGVPAPD 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD PTTAAFDCFPDTTAASSADSANPFAWPEENLGDACPRWGLHPGELTKGLEQGGKASDGIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PTTAAFDCFPDTTAASSADSANPFAWPEENLGDACPRWGLHPGELTKGLEQGGKASDGIS 730 740 750 760 770 780 790 800 810 820 830 840 pF1KSD KGDTHEASACLGFQEEDPPGEKVASLPGDFKQEEVGGVKEEAGGLLQCPEVAKADRWLED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 KGDTHEASACLGFQEEDPPGEKVASLPGDFKQEEVGGVKEEAGGLLQCPEVAKADRWLED 790 800 810 820 830 840 850 860 870 880 890 900 pF1KSD SRHCCSTADFGDLPLLPPTSRKEDLEAEEEYSSLCELLGSPEQRPGMQDPLSPKAPLICT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SRHCCSTADFGDLPLLPPTSRKEDLEAEEEYSSLCELLGSPEQRPGMQDPLSPKAPLICT 850 860 870 880 890 900 910 920 930 940 950 960 pF1KSD KEEVEEVLDSKAGWGSPCHLSGESVILLGPTVGTESKVQSWFESSLSHMKPGEEGPDGER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 KEEVEEVLDSKAGWGSPCHLSGESVILLGPTVGTESKVQSWFESSLSHMKPGEEGPDGER 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KSD APGDSTTSDASLAQKPNKPAVPEAPIAKKEPVPRGKSLRSRRVHRGLPEAEDSPCRAPVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 APGDSTTSDASLAQKPNKPAVPEAPIAKKEPVPRGKSLRSRRVHRGLPEAEDSPCRAPVL 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KSD PKDLLLPESCTGPPQGQMEGAGAPGRGASEGLPRMCTRSLTALSEPRTPGPPGLTTTPAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PKDLLLPESCTGPPQGQMEGAGAPGRGASEGLPRMCTRSLTALSEPRTPGPPGLTTTPAP 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KSD PDKLGGKQRAAFKSGKRVGKPSPKAASSPSNPAALPVASDSSPMGSKTKETDSPSTPGKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PDKLGGKQRAAFKSGKRVGKPSPKAASSPSNPAALPVASDSSPMGSKTKETDSPSTPGKD 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KSD QRSMILRSRTKTQEIFHSKRRRPSEGRLPNCRATKKLLDNSHLPATFKVSSSPQKEGRVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 QRSMILRSRTKTQEIFHSKRRRPSEGRLPNCRATKKLLDNSHLPATFKVSSSPQKEGRVS 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KSD QRARVPKPGAGSKLSDRPLHALKRKSAFMAPVPTKKRNLVLRSRSSSSSNASGNGGDGKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 QRARVPKPGAGSKLSDRPLHALKRKSAFMAPVPTKKRNLVLRSRSSSSSNASGNGGDGKE 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KSD ERPEGSPTLFKRMSSPKKAKPTKGNGEPATKLPPPETPDACLKLASRAAFQGAMKTKVLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ERPEGSPTLFKRMSSPKKAKPTKGNGEPATKLPPPETPDACLKLASRAAFQGAMKTKVLP 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KSD PRKGRGLKLEAIVQKITSPSLKKFACKAPGASPGNPLSPSLSDKDRGLKGAGGSPVGVEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PRKGRGLKLEAIVQKITSPSLKKFACKAPGASPGNPLSPSLSDKDRGLKGAGGSPVGVEE 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KSD GLVNVGTGQKLPTSGADPLCRNPTNRSLKGKLMNSKKLSSTDCFKTEAFTSPEALQPGGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 GLVNVGTGQKLPTSGADPLCRNPTNRSLKGKLMNSKKLSSTDCFKTEAFTSPEALQPGGT 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KSD ALAPKKRSRKGRAGAHGLSKGPLEKRPYLGPALLLTPRDRASGTQGASEDNSGGGGKKPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ALAPKKRSRKGRAGAHGLSKGPLEKRPYLGPALLLTPRDRASGTQGASEDNSGGGGKKPK 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KSD MEELGLASQPPEGRPCQPQTRAQKQPGHTNYSSYSKRKRLTRGRAKNTTSSPCKGRAKRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MEELGLASQPPEGRPCQPQTRAQKQPGHTNYSSYSKRKRLTRGRAKNTTSSPCKGRAKRR 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KSD RQQQVLPLDPAEPEIRLKYISSCKRLRSDSRTPAFSPLEPSLGAQNPRSGQNAPPAPADA :::::::::::::::::::::::::::::::::::::. CCDS11 RQQQVLPLDPAEPEIRLKYISSCKRLRSDSRTPAFSPFVRVEKRDAFTTICTVVNSPGDA 1570 1580 1590 1600 1610 1620 1630 1640 pF1KSD RPLCTTRDRRAYSAREQGQR CCDS11 PKPHRKPSSSASSSSSSSSFSLDAAGASLATLPGGSILQPRPSLPLSSTMHLGPVVSKAL 1630 1640 1650 1660 1670 1680 >>CCDS14032.1 TCF20 gene_id:6942|Hs108|chr22 (1938 aa) initn: 579 init1: 296 opt: 793 Z-score: 417.2 bits: 90.4 E(32554): 6.4e-17 Smith-Waterman score: 1072; 25.6% identity (51.9% similar) in 1745 aa overlap (1-1597:1-1633) 10 20 30 40 50 60 pF1KSD MQSFRERCGFHGKQQNYQQTSQETSRLENYRQPSQAGLSCDRQRLLAKDYYNPQPYPSYE ::::::. ..::.::.: : . .::::.. .: :: : . . . : CCDS14 MQSFREQSSYHGNQQSYPQEVHGSSRLEEF-SPRQA------QMFQNFGGTGGSSGSSGS 10 20 30 40 50 70 80 90 100 110 pF1KSD GGAGTPSGTAAAVAA----DKYHRGSKALPTQQGLQGRPAFPGYGVQDSSPYPGRYAGEE :..: :.:::.:: . :.: ... . : : : ..: : . CCDS14 GSGGGRRGAAAAAAAMASETSGHQGYQGFRKEAGDFYYMAGNKDPVTTGTPQPPQRRPSG 60 70 80 90 100 110 120 130 140 150 160 pF1KSD SLQAWGAPQPPP-----------PQPQPLPAG---VAKYDENLMKKTAVPPSRQYAEQGA .:..: :: : : .: :..:... . : : :: .:.. CCDS14 PVQSYGPPQGSSFGNQYGSEGHVGQFQAQHSGLGGVSHYQQDYTGPFS-PGSAQYQQQAS 120 130 140 150 160 170 170 180 190 200 pF1KSD ------QVPFRTHSLHVQQPPPPQQPLAYPKLQRQKLQNDIASPLPFPQGT--------H :: ..:. .. : :: . : . ..:: . : .:... . CCDS14 SQQQQQQVQQLRQQLYQSHQPLPQAT-GQPASSSSHLQ-PMQRPSTLPSSAAGYQLRVGQ 180 190 200 210 220 230 210 220 230 240 250 260 pF1KSD FPQHSQSFPTSSTYSS--SVQGGGQGAHSYK-SCTAPTAQPHDRPLTASSSLAPGQRVQN : :: :: .::. :: : : .:...:: : .. ... .. ..:.. : : .:. CCDS14 FGQHYQSSASSSSSSSFPSPQRFSQSGQSYDGSYNVNAGSQYEGHNVGSNAQAYG--TQS 240 250 260 270 280 270 280 290 300 310 320 pF1KSD LHAYQSGRL-SYDQQQ--QQQQQQQQQQQALQSRHHAQETLHYQNLA-KYQHYGQQGQGY ..:: . ...: . : :: ::::: :..: .:....: : : : .: :: : CCDS14 NYSYQPQSMKNFEQAKIPQGTQQGQQQQQPQQQQHPSQHVMQYTNAATKLPLQSQVGQ-Y 290 300 310 320 330 340 330 340 350 360 370 380 pF1KSD CQPDAAVRTPEQYYQTFSPSSSHSPARSVGRSPSYSSTPSPLMPNLENFPYSQQPLSTGA ::.. ::.: :..:.::: :. ::: :: .::: :::::::: . ::. .: :. CCDS14 NQPEVPVRSPMQFHQNFSPISNPSPAASVVQSPSCSSTPSPLMQTGENLQCGQ-----GS 350 360 370 380 390 400 390 400 410 420 430 440 pF1KSD FPAGITDHS-HFMPLLNPSPTDATSSVDTQAGNCKPLQKDKLPENLLSDLSLQSLTALTS : : .. ..:: :.:.:. : ...:.. : . . .::. :.: .:.::.::.. CCDS14 VPMGSRNRILQLMPQLSPTPS-MMPSPNSHAAGFKGFGLEGVPEKRLTDPGLSSLSALST 410 420 430 440 450 460 450 460 470 480 490 pF1KSD QVENISNTVQQLLLSKAAVPQKKGVKNLVSRTPEQHKSQHCS-PEGSGYSAEPAGTPLSE :: :. ::::..::: : .:::: : : ..:.. :. :::. : .:..: CCDS14 QVANLPNTVQHMLLSDALTPQKKTSK----RPSSSKKADSCTNSEGSSQPEEQLKSPMAE 470 480 490 500 510 500 510 520 530 540 550 pF1KSD P-PSSTPQSTHAEPQEADYLSGSEDPLERSFL--YCNQARGSPARVNSNSKAKPESVSTC .. .:.. . ... :::. . .. ..: .:::. ... .: ... CCDS14 SLDGGCSSSSEDQGERVRQLSGQSTSSDTTYKGGASEKAGSSPAQ---GAQNEPPRLNAS 520 530 540 550 560 570 560 570 580 590 600 610 pF1KSD SVTSPDDMSTKSDDSFQSLHGSLPLDSFSKFVAGERDCPRLLLSALAQEDLASEILGLQE .. . : . : .::.: .. ..:. .. ..: ..... : CCDS14 PAAREEATSPGAKD--------MPLSSDGNPKVNEKTVGVIV----SREAMTGRV----E 580 590 600 610 620 630 640 650 660 670 pF1KSD AIGEKADKAWAEAPSLVKDSSKPPFSLENHSACLDSVAKSAWPRPGEPEALPDSLQLDKG : . . . :. ...:: : .: : :. :.: . . . :.. CCDS14 KPGGQDKGSQEDDPAA---TQRPP---SNGGAKETSHASLPQPEPPGGGGSKGNKNGDNN 620 630 640 650 660 670 680 690 700 710 720 730 pF1KSD GNAKDFSPGLFEDPSVA--FAT-PDPKKTTGPLSFGTKPTLGVPAPDPTTAAFDCFPDTT .: . . : ... :.. .:.:. : : .. : ..: .: ....: .: : CCDS14 SNHNGEGNGQSGHSAAGPGFTSRTEPSKSPGSLRYSYKDSFGSAVPR-NVSGFPQYP--T 680 690 700 710 720 740 750 760 770 780 790 pF1KSD AASSADSANPFAWPEENLGDACPRWGLHPGELTKGLEQGGKASDGISKGDTHEASACLGF . ..: :. : : : :. : . :. . : . .:.: .. : CCDS14 GQEKGD----FTGHGERKG----RNEKFPSLLQEVLQGYHHHPDRRYSRSTQEHQGMAGS 730 740 750 760 770 780 800 810 820 830 840 850 pF1KSD QEEDPPGEKVASLPGDFKQEEVGGVKEEAGGLLQCPEVAKADRWLEDSRHCCSTA-DFGD : . ..: ... .. : ... :.::. :. : :. ::: .. . CCDS14 LEGTTRPNVLVSQTNELASR--GLLNKSIGSLLENPH------WGPWERKSSSTAPEMKQ 790 800 810 820 830 860 870 880 890 900 pF1KSD LPLLP-PTSRKEDLEAEEEYSSLCELLGSPEQRPGMQDPLSPKAPLICTKEEVEEVL--- . : : :: ..: . :: : :: .: .. .:: .. .. . : CCDS14 INLTDYPIPRKFEIEPQ---SSAHEPGGSLSERRSVICDISPLRQIV--RDPGAHSLGHM 840 850 860 870 880 910 920 930 940 pF1KSD --DSKAGWGSPCHLS-GESVILLGPTVGTESKVQSW--------FESSLS---------- :.. : .. . . ..:::: : :. :.:..: ::.: : CCDS14 SADTRIGRNDRLNPTLSQSVILPGGLVSMETKLKSQSGQIKEEDFEQSKSQASFNNKKSG 890 900 910 920 930 940 950 960 970 980 990 pF1KSD -HMKPG---EEGPDGERAPGDSTTSDAS-LAQKPNKPA-VPEAP--IAKKEPVPRGKSLR : .: .:. :. .:: .: .. : . . ..:. . ..: .. .: . ::.: CCDS14 DHCHPPSIKHESYRGNASPGAATHDSLSDYGPQDSRPTPMRRVPGRVGGREGM-RGRS-- 950 960 970 980 990 1000 1000 1010 1020 1030 1040 1050 pF1KSD SRRVHRGLPEAEDSP--CRAPVLPKDLLLPESCTGPPQGQMEGAGAPGRGASEGLPRMCT . : . . :: :.: . :. : ... . .: :: : . CCDS14 PSQYHDFAEKLKMSPGRSRGPGGDPHHMNPHM-TFSERANRSSLHTPFSPNSETL----A 1010 1020 1030 1040 1050 1060 1060 1070 1080 1090 1100 pF1KSD RSLTALSEPRTPGPP--GLTTTPAPPDKLGGKQRAAFK---SGKRVG--------KPSPK . : .. .. : : ::.. .. .: .: ::. : . .:. CCDS14 SAYHANTRAHAYGDPNAGLNSQLHYKRQMYQQQPEEYKDWSSGSAQGVIAAAQHRQEGPR 1070 1080 1090 1100 1110 1120 1110 1120 1130 1140 pF1KSD AASSPSNPAAL-----PVASDSSPM--GSKTKETDSPS----------TPGKDQRSMILR .:: . : :. .:.. : : . .:: . : ...: :. CCDS14 --KSPRQQQFLDRVRSPLKNDKDGMMYGPPVGTYHDPSAQEAGRCLMSSDGLPNKGMELK 1130 1140 1150 1160 1170 1150 1160 1170 1180 1190 1200 pF1KSD SRT-KTQEIFH--SKRRRPSEGRLPNCRATKKLLDNSHLPATFKVSSSPQ--KEGRVSQR . : :: :.. :... : ...: : .. . : : : : : CCDS14 HGSQKLQESCWDLSRQTSPAKSSGPPGMSSQKRYGPPHETDGHGLAEATQSSKPGSVMLR 1180 1190 1200 1210 1220 1230 1210 1220 1230 1240 1250 1260 pF1KSD ARVPKPGAGSKLSDRPLHALKRKSAFMAPVPTKKRNLVLRSRSSSSSNASGNGGDGKEER :: .. :. :: .: .:..:.:.:... ... ::.. .: ...: CCDS14 L----PGQEDHSSQNPLIMRRRVRSFISPIPSKRQSQDVKN---SSTEDKGRLLHSSKEG 1240 1250 1260 1270 1280 1290 1270 1280 1290 1300 1310 1320 pF1KSD PEGSPTLFKRMSSPKKAKPTKGNGEPATKLPPPETPDACLKLASRAAFQGAMKTKVLPPR . . . . ..: . : . . . . :: :.. . : ... . :::.:::: CCDS14 ADKAFNSYAHLSHSQDIK-SIPKRDSSKDLPSPDSRN-C----PAVTLTSPAKTKILPPR 1300 1310 1320 1330 1340 1330 1340 1350 1360 1370 1380 pF1KSD KGRGLKLEAIVQKITSPSLKKFACKAPGASPGNPLSPSLSDKDRGLKGAGGSPVGVEEGL :::::::::::::::::.... : . . . :. . .:.: :. .: : : : CCDS14 KGRGLKLEAIVQKITSPNIRRSASSNSAEAGGDTV--TLDDI---LSLKSGPPEG---GS 1350 1360 1370 1380 1390 1390 1400 1410 1420 1430 pF1KSD VNVGTGQKLPTSG--ADPLCRNPTNRSL--KGKLMNSK---KLSSTDCFKTE--AFTSPE : : .. .: :. : .:.:. : . : :. . : : ::: : : CCDS14 VAVQDADIEKRKGEVASDLV-SPANQELHVEKPLPRSSEEWRGSVDDKVKTETHAETVTA 1400 1410 1420 1430 1440 1450 1440 1450 1460 1470 1480 pF1KSD ALQPGG---TALAPKKRSRKGRAGAHGLSKGPL--EKRPYLGPALLLTPR------DRAS . .: : .. . : : .:: . . .:: . :. .:.:. .. . CCDS14 GKEPPGAMTSTTSQKPGSNQGRPDGSLGGTAPLIFPDSKNVPPVGILAPEANPKAEEKEN 1460 1470 1480 1490 1500 1510 1490 1500 1510 1520 1530 pF1KSD GTQGASEDNSG----G---GGKKPKMEELG-LASQPPEGRPCQPQTRAQKQP-GHTNYSS : : . : : .::: : . .: . .: . .: : . . : : .. CCDS14 DTVTISPKQEGFPPKGYFPSGKK-KGRPIGSVNKQKKQQQPPPPPPQPPQIPEGSADGEP 1520 1530 1540 1550 1560 1570 1540 1550 1560 1570 1580 1590 pF1KSD YSKRKRLTRGRAKNTTSSPCKGRAKRRRQQQVLPL-DPAEPEIRLKYISSCKRLRSDSRT :..: : : : ..: ..:. .:..:. .: ::::.::: .. ..:... CCDS14 KPKKQRQRRERRK-PGAQP-----RKRKTKQAVPIVEPQEPEIKLKYATQ-PLDKTDAKN 1580 1590 1600 1610 1620 1600 1610 1620 1630 1640 pF1KSD PAFSPLEPSLGAQNPRSGQNAPPAPADARPLCTTRDRRAYSAREQGQR .: : CCDS14 KSFYPYIHVVNKCELGAVCTIINAEEEEQTKLVRGRKGQRSLTPPPSSTESKALPASSFM 1630 1640 1650 1660 1670 1680 >>CCDS14033.1 TCF20 gene_id:6942|Hs108|chr22 (1960 aa) initn: 579 init1: 296 opt: 793 Z-score: 417.2 bits: 90.4 E(32554): 6.5e-17 Smith-Waterman score: 1072; 25.6% identity (51.9% similar) in 1745 aa overlap (1-1597:1-1633) 10 20 30 40 50 60 pF1KSD MQSFRERCGFHGKQQNYQQTSQETSRLENYRQPSQAGLSCDRQRLLAKDYYNPQPYPSYE ::::::. ..::.::.: : . .::::.. .: :: : . . . : CCDS14 MQSFREQSSYHGNQQSYPQEVHGSSRLEEF-SPRQA------QMFQNFGGTGGSSGSSGS 10 20 30 40 50 70 80 90 100 110 pF1KSD GGAGTPSGTAAAVAA----DKYHRGSKALPTQQGLQGRPAFPGYGVQDSSPYPGRYAGEE :..: :.:::.:: . :.: ... . : : : ..: : . CCDS14 GSGGGRRGAAAAAAAMASETSGHQGYQGFRKEAGDFYYMAGNKDPVTTGTPQPPQRRPSG 60 70 80 90 100 110 120 130 140 150 160 pF1KSD SLQAWGAPQPPP-----------PQPQPLPAG---VAKYDENLMKKTAVPPSRQYAEQGA .:..: :: : : .: :..:... . : : :: .:.. CCDS14 PVQSYGPPQGSSFGNQYGSEGHVGQFQAQHSGLGGVSHYQQDYTGPFS-PGSAQYQQQAS 120 130 140 150 160 170 170 180 190 200 pF1KSD ------QVPFRTHSLHVQQPPPPQQPLAYPKLQRQKLQNDIASPLPFPQGT--------H :: ..:. .. : :: . : . ..:: . : .:... . CCDS14 SQQQQQQVQQLRQQLYQSHQPLPQAT-GQPASSSSHLQ-PMQRPSTLPSSAAGYQLRVGQ 180 190 200 210 220 230 210 220 230 240 250 260 pF1KSD FPQHSQSFPTSSTYSS--SVQGGGQGAHSYK-SCTAPTAQPHDRPLTASSSLAPGQRVQN : :: :: .::. :: : : .:...:: : .. ... .. ..:.. : : .:. CCDS14 FGQHYQSSASSSSSSSFPSPQRFSQSGQSYDGSYNVNAGSQYEGHNVGSNAQAYG--TQS 240 250 260 270 280 270 280 290 300 310 320 pF1KSD LHAYQSGRL-SYDQQQ--QQQQQQQQQQQALQSRHHAQETLHYQNLA-KYQHYGQQGQGY ..:: . ...: . : :: ::::: :..: .:....: : : : .: :: : CCDS14 NYSYQPQSMKNFEQAKIPQGTQQGQQQQQPQQQQHPSQHVMQYTNAATKLPLQSQVGQ-Y 290 300 310 320 330 340 330 340 350 360 370 380 pF1KSD CQPDAAVRTPEQYYQTFSPSSSHSPARSVGRSPSYSSTPSPLMPNLENFPYSQQPLSTGA ::.. ::.: :..:.::: :. ::: :: .::: :::::::: . ::. .: :. CCDS14 NQPEVPVRSPMQFHQNFSPISNPSPAASVVQSPSCSSTPSPLMQTGENLQCGQ-----GS 350 360 370 380 390 400 390 400 410 420 430 440 pF1KSD FPAGITDHS-HFMPLLNPSPTDATSSVDTQAGNCKPLQKDKLPENLLSDLSLQSLTALTS : : .. ..:: :.:.:. : ...:.. : . . .::. :.: .:.::.::.. CCDS14 VPMGSRNRILQLMPQLSPTPS-MMPSPNSHAAGFKGFGLEGVPEKRLTDPGLSSLSALST 410 420 430 440 450 460 450 460 470 480 490 pF1KSD QVENISNTVQQLLLSKAAVPQKKGVKNLVSRTPEQHKSQHCS-PEGSGYSAEPAGTPLSE :: :. ::::..::: : .:::: : : ..:.. :. :::. : .:..: CCDS14 QVANLPNTVQHMLLSDALTPQKKTSK----RPSSSKKADSCTNSEGSSQPEEQLKSPMAE 470 480 490 500 510 500 510 520 530 540 550 pF1KSD P-PSSTPQSTHAEPQEADYLSGSEDPLERSFL--YCNQARGSPARVNSNSKAKPESVSTC .. .:.. . ... :::. . .. ..: .:::. ... .: ... CCDS14 SLDGGCSSSSEDQGERVRQLSGQSTSSDTTYKGGASEKAGSSPAQ---GAQNEPPRLNAS 520 530 540 550 560 570 560 570 580 590 600 610 pF1KSD SVTSPDDMSTKSDDSFQSLHGSLPLDSFSKFVAGERDCPRLLLSALAQEDLASEILGLQE .. . : . : .::.: .. ..:. .. ..: ..... : CCDS14 PAAREEATSPGAKD--------MPLSSDGNPKVNEKTVGVIV----SREAMTGRV----E 580 590 600 610 620 630 640 650 660 670 pF1KSD AIGEKADKAWAEAPSLVKDSSKPPFSLENHSACLDSVAKSAWPRPGEPEALPDSLQLDKG : . . . :. ...:: : .: : :. :.: . . . :.. CCDS14 KPGGQDKGSQEDDPAA---TQRPP---SNGGAKETSHASLPQPEPPGGGGSKGNKNGDNN 620 630 640 650 660 670 680 690 700 710 720 730 pF1KSD GNAKDFSPGLFEDPSVA--FAT-PDPKKTTGPLSFGTKPTLGVPAPDPTTAAFDCFPDTT .: . . : ... :.. .:.:. : : .. : ..: .: ....: .: : CCDS14 SNHNGEGNGQSGHSAAGPGFTSRTEPSKSPGSLRYSYKDSFGSAVPR-NVSGFPQYP--T 680 690 700 710 720 740 750 760 770 780 790 pF1KSD AASSADSANPFAWPEENLGDACPRWGLHPGELTKGLEQGGKASDGISKGDTHEASACLGF . ..: :. : : : :. : . :. . : . .:.: .. : CCDS14 GQEKGD----FTGHGERKG----RNEKFPSLLQEVLQGYHHHPDRRYSRSTQEHQGMAGS 730 740 750 760 770 780 800 810 820 830 840 850 pF1KSD QEEDPPGEKVASLPGDFKQEEVGGVKEEAGGLLQCPEVAKADRWLEDSRHCCSTA-DFGD : . ..: ... .. : ... :.::. :. : :. ::: .. . CCDS14 LEGTTRPNVLVSQTNELASR--GLLNKSIGSLLENPH------WGPWERKSSSTAPEMKQ 790 800 810 820 830 860 870 880 890 900 pF1KSD LPLLP-PTSRKEDLEAEEEYSSLCELLGSPEQRPGMQDPLSPKAPLICTKEEVEEVL--- . : : :: ..: . :: : :: .: .. .:: .. .. . : CCDS14 INLTDYPIPRKFEIEPQ---SSAHEPGGSLSERRSVICDISPLRQIV--RDPGAHSLGHM 840 850 860 870 880 910 920 930 940 pF1KSD --DSKAGWGSPCHLS-GESVILLGPTVGTESKVQSW--------FESSLS---------- :.. : .. . . ..:::: : :. :.:..: ::.: : CCDS14 SADTRIGRNDRLNPTLSQSVILPGGLVSMETKLKSQSGQIKEEDFEQSKSQASFNNKKSG 890 900 910 920 930 940 950 960 970 980 990 pF1KSD -HMKPG---EEGPDGERAPGDSTTSDAS-LAQKPNKPA-VPEAP--IAKKEPVPRGKSLR : .: .:. :. .:: .: .. : . . ..:. . ..: .. .: . ::.: CCDS14 DHCHPPSIKHESYRGNASPGAATHDSLSDYGPQDSRPTPMRRVPGRVGGREGM-RGRS-- 950 960 970 980 990 1000 1000 1010 1020 1030 1040 1050 pF1KSD SRRVHRGLPEAEDSP--CRAPVLPKDLLLPESCTGPPQGQMEGAGAPGRGASEGLPRMCT . : . . :: :.: . :. : ... . .: :: : . CCDS14 PSQYHDFAEKLKMSPGRSRGPGGDPHHMNPHM-TFSERANRSSLHTPFSPNSETL----A 1010 1020 1030 1040 1050 1060 1060 1070 1080 1090 1100 pF1KSD RSLTALSEPRTPGPP--GLTTTPAPPDKLGGKQRAAFK---SGKRVG--------KPSPK . : .. .. : : ::.. .. .: .: ::. : . .:. CCDS14 SAYHANTRAHAYGDPNAGLNSQLHYKRQMYQQQPEEYKDWSSGSAQGVIAAAQHRQEGPR 1070 1080 1090 1100 1110 1120 1110 1120 1130 1140 pF1KSD AASSPSNPAAL-----PVASDSSPM--GSKTKETDSPS----------TPGKDQRSMILR .:: . : :. .:.. : : . .:: . : ...: :. CCDS14 --KSPRQQQFLDRVRSPLKNDKDGMMYGPPVGTYHDPSAQEAGRCLMSSDGLPNKGMELK 1130 1140 1150 1160 1170 1150 1160 1170 1180 1190 1200 pF1KSD SRT-KTQEIFH--SKRRRPSEGRLPNCRATKKLLDNSHLPATFKVSSSPQ--KEGRVSQR . : :: :.. :... : ...: : .. . : : : : : CCDS14 HGSQKLQESCWDLSRQTSPAKSSGPPGMSSQKRYGPPHETDGHGLAEATQSSKPGSVMLR 1180 1190 1200 1210 1220 1230 1210 1220 1230 1240 1250 1260 pF1KSD ARVPKPGAGSKLSDRPLHALKRKSAFMAPVPTKKRNLVLRSRSSSSSNASGNGGDGKEER :: .. :. :: .: .:..:.:.:... ... ::.. .: ...: CCDS14 L----PGQEDHSSQNPLIMRRRVRSFISPIPSKRQSQDVKN---SSTEDKGRLLHSSKEG 1240 1250 1260 1270 1280 1290 1270 1280 1290 1300 1310 1320 pF1KSD PEGSPTLFKRMSSPKKAKPTKGNGEPATKLPPPETPDACLKLASRAAFQGAMKTKVLPPR . . . . ..: . : . . . . :: :.. . : ... . :::.:::: CCDS14 ADKAFNSYAHLSHSQDIK-SIPKRDSSKDLPSPDSRN-C----PAVTLTSPAKTKILPPR 1300 1310 1320 1330 1340 1330 1340 1350 1360 1370 1380 pF1KSD KGRGLKLEAIVQKITSPSLKKFACKAPGASPGNPLSPSLSDKDRGLKGAGGSPVGVEEGL :::::::::::::::::.... : . . . :. . .:.: :. .: : : : CCDS14 KGRGLKLEAIVQKITSPNIRRSASSNSAEAGGDTV--TLDDI---LSLKSGPPEG---GS 1350 1360 1370 1380 1390 1390 1400 1410 1420 1430 pF1KSD VNVGTGQKLPTSG--ADPLCRNPTNRSL--KGKLMNSK---KLSSTDCFKTE--AFTSPE : : .. .: :. : .:.:. : . : :. . : : ::: : : CCDS14 VAVQDADIEKRKGEVASDLV-SPANQELHVEKPLPRSSEEWRGSVDDKVKTETHAETVTA 1400 1410 1420 1430 1440 1450 1440 1450 1460 1470 1480 pF1KSD ALQPGG---TALAPKKRSRKGRAGAHGLSKGPL--EKRPYLGPALLLTPR------DRAS . .: : .. . : : .:: . . .:: . :. .:.:. .. . CCDS14 GKEPPGAMTSTTSQKPGSNQGRPDGSLGGTAPLIFPDSKNVPPVGILAPEANPKAEEKEN 1460 1470 1480 1490 1500 1510 1490 1500 1510 1520 1530 pF1KSD GTQGASEDNSG----G---GGKKPKMEELG-LASQPPEGRPCQPQTRAQKQP-GHTNYSS : : . : : .::: : . .: . .: . .: : . . : : .. CCDS14 DTVTISPKQEGFPPKGYFPSGKK-KGRPIGSVNKQKKQQQPPPPPPQPPQIPEGSADGEP 1520 1530 1540 1550 1560 1570 1540 1550 1560 1570 1580 1590 pF1KSD YSKRKRLTRGRAKNTTSSPCKGRAKRRRQQQVLPL-DPAEPEIRLKYISSCKRLRSDSRT :..: : : : ..: ..:. .:..:. .: ::::.::: .. ..:... CCDS14 KPKKQRQRRERRK-PGAQP-----RKRKTKQAVPIVEPQEPEIKLKYATQ-PLDKTDAKN 1580 1590 1600 1610 1620 1600 1610 1620 1630 1640 pF1KSD PAFSPLEPSLGAQNPRSGQNAPPAPADARPLCTTRDRRAYSAREQGQR .: : CCDS14 KSFYPYIHVVNKCELGAVCTIINAEEEEQTKLVRGRKGQRSLTPPPSSTESKALPASSFM 1630 1640 1650 1660 1670 1680 1640 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 19:11:49 2016 done: Thu Nov 3 19:11:51 2016 Total Scan time: 5.970 Total Display time: 0.240 Function used was FASTA [36.3.4 Apr, 2011]