FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5645, 1170 aa 1>>>pF1KB5645 1170 - 1170 aa - 1170 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.5360+/-0.00136; mu= 18.2411+/- 0.081 mean_var=209.1887+/-39.679, 0's: 0 Z-trim(108.2): 193 B-trim: 0 in 0/51 Lambda= 0.088676 statistics sampled from 9842 (10052) to 9842 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.651), E-opt: 0.2 (0.309), width: 16 Scan time: 5.010 The best scores are: opt bits E(32554) CCDS32194.1 THBS1 gene_id:7057|Hs108|chr15 (1170) 8531 1106.1 0 CCDS34574.1 THBS2 gene_id:7058|Hs108|chr6 (1172) 5578 728.3 2.6e-209 CCDS12385.1 COMP gene_id:1311|Hs108|chr19 ( 757) 2502 334.5 5.9e-91 CCDS58034.1 THBS3 gene_id:7059|Hs108|chr1 ( 836) 2422 324.3 7.5e-88 CCDS72937.1 THBS3 gene_id:7059|Hs108|chr1 ( 947) 2422 324.4 8e-88 CCDS1099.1 THBS3 gene_id:7059|Hs108|chr1 ( 956) 2422 324.4 8.1e-88 CCDS78027.1 THBS4 gene_id:7060|Hs108|chr5 ( 870) 2364 316.9 1.3e-85 CCDS4049.1 THBS4 gene_id:7060|Hs108|chr5 ( 961) 2364 317.0 1.4e-85 CCDS30956.1 HMCN1 gene_id:83872|Hs108|chr1 (5635) 705 105.8 3e-21 CCDS64985.1 ADGRB1 gene_id:575|Hs108|chr8 (1584) 601 91.7 1.5e-17 CCDS4968.1 ADGRB3 gene_id:577|Hs108|chr6 (1522) 568 87.5 2.7e-16 CCDS14282.1 CFP gene_id:5199|Hs108|chrX ( 469) 543 83.6 1.2e-15 CCDS72746.1 ADGRB2 gene_id:576|Hs108|chr1 (1551) 540 83.9 3.2e-15 CCDS72747.1 ADGRB2 gene_id:576|Hs108|chr1 (1584) 540 83.9 3.3e-15 CCDS3875.1 SEMA5A gene_id:9037|Hs108|chr5 (1074) 474 75.3 9e-13 CCDS74995.1 SEMA5B gene_id:54437|Hs108|chr3 (1057) 460 73.5 3.1e-12 CCDS35491.1 SEMA5B gene_id:54437|Hs108|chr3 (1151) 459 73.4 3.6e-12 CCDS58848.1 SEMA5B gene_id:54437|Hs108|chr3 (1205) 459 73.4 3.7e-12 >>CCDS32194.1 THBS1 gene_id:7057|Hs108|chr15 (1170 aa) initn: 8531 init1: 8531 opt: 8531 Z-score: 5913.0 bits: 1106.1 E(32554): 0 Smith-Waterman score: 8531; 99.9% identity (100.0% similar) in 1170 aa overlap (1-1170:1-1170) 10 20 30 40 50 60 pF1KB5 MGLAWGLGVLFLMHVCGTNRIPESGGDNSVFDIFELTGAARKGSGRRLVKGPDPSSPAFR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 MGLAWGLGVLFLMHVCGTNRIPESGGDNSVFDIFELTGAARKGSGRRLVKGPDPSSPAFR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 IEDANLIPPVPDDKFQDLVDAVRAEKGFLLLASLRQMKKTRGTLLALERKDHSGQVFSVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 IEDANLIPPVPDDKFQDLVDAVRAEKGFLLLASLRQMKKTRGTLLALERKDHSGQVFSVV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 SNGKAGTLDLSLTVQGKQHVVSVEEALLATGQWKSITLFVQEDRAQLYIDCEKMENAELD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 SNGKAGTLDLSLTVQGKQHVVSVEEALLATGQWKSITLFVQEDRAQLYIDCEKMENAELD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 VPIQSVFTRDLASIARLRIAKGGVNDNFQGVLQNVRFVFGTTPEDILRNKGCSSSTSVLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 VPIQSVFTRDLASIARLRIAKGGVNDNFQGVLQNVRFVFGTTPEDILRNKGCSSSTSVLL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 TLDNNVVNGSSPAIRTNYIGHKTKDLQAICGISCDELSSMVLELRGLRTIVTTLQDSIRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 TLDNNVVNGSSPAIRTNYIGHKTKDLQAICGISCDELSSMVLELRGLRTIVTTLQDSIRK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 VTEENKELANELRRPPLCYHNGVQYRNNEEWTVDSCTECHCQNSVTICKKVSCPIMPCSN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 VTEENKELANELRRPPLCYHNGVQYRNNEEWTVDSCTECHCQNSVTICKKVSCPIMPCSN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 ATVPDGECCPRCWPSDSADDGWSPWSEWTSCSTSCGNGIQQRGRSCDSLNNRCEGSSVQT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 ATVPDGECCPRCWPSDSADDGWSPWSEWTSCSTSCGNGIQQRGRSCDSLNNRCEGSSVQT 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 RTCHIQECDKRFKQDGGWSHWSPWSSCSVTCGDGVITRIRLCNSPSPQMNGKPCEGEARE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 RTCHIQECDKRFKQDGGWSHWSPWSSCSVTCGDGVITRIRLCNSPSPQMNGKPCEGEARE 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB5 TKACKKDACPINGGWGPWSPWDICSVTCGGGVQKRSRLCNNPTPQFGGKDCVGDVTENQI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 TKACKKDACPINGGWGPWSPWDICSVTCGGGVQKRSRLCNNPTPQFGGKDCVGDVTENQI 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB5 CNKQDCPIDGCLSNPCFAGVKCTSYPDGSWKCGACPPGYSGNGIQCTDVDECKEVPDACF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 CNKQDCPIDGCLSNPCFAGVKCTSYPDGSWKCGACPPGYSGNGIQCTDVDECKEVPDACF 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB5 NHNGEHRCENTDPGYNCLPCPPRFTGSQPFGQGVEHATANKQVCKPRNPCTDGTHDCNKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 NHNGEHRCENTDPGYNCLPCPPRFTGSQPFGQGVEHATANKQVCKPRNPCTDGTHDCNKN 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB5 AKCNYLGHYSDPMYRCECKPGYAGNGIICGEDTDLDGWPSENLVCVANATYHCKKDNCPN :::::::::::::::::::::::::::::::::::::::.:::::::::::::::::::: CCDS32 AKCNYLGHYSDPMYRCECKPGYAGNGIICGEDTDLDGWPNENLVCVANATYHCKKDNCPN 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB5 LPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPAQYDYDRDDVGDRCDNCPYN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPAQYDYDRDDVGDRCDNCPYN 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB5 HNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQRDTDMDGVGDQCDNCPLEH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 HNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQRDTDMDGVGDQCDNCPLEH 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB5 NPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNANQADHDKDGKGDACDHDDDN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 NPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNANQADHDKDGKGDACDHDDDN 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB5 DGIPDDKDNCRLVPNPDQKDSDGDGRGDACKDDFDHDSVPDIDDICPENVDISETDFRRF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 DGIPDDKDNCRLVPNPDQKDSDGDGRGDACKDDFDHDSVPDIDDICPENVDISETDFRRF 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB5 QMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLAVGYDEFNAVDFSGTFFINTERDD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 QMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLAVGYDEFNAVDFSGTFFINTERDD 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KB5 DYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQGYSGLSVKVVNSTTGPGEHLRNAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 DYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQGYSGLSVKVVNSTTGPGEHLRNAL 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KB5 WHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPKTGFIRVVMYEGKKIMADSGPIYD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 WHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPKTGFIRVVMYEGKKIMADSGPIYD 1090 1100 1110 1120 1130 1140 1150 1160 1170 pF1KB5 KTYAGGRLGLFVFSQEMVFFSDLKYECRDP :::::::::::::::::::::::::::::: CCDS32 KTYAGGRLGLFVFSQEMVFFSDLKYECRDP 1150 1160 1170 >>CCDS34574.1 THBS2 gene_id:7058|Hs108|chr6 (1172 aa) initn: 5432 init1: 4955 opt: 5578 Z-score: 3871.3 bits: 728.3 E(32554): 2.6e-209 Smith-Waterman score: 5612; 61.6% identity (83.0% similar) in 1176 aa overlap (3-1169:1-1171) 10 20 30 40 50 60 pF1KB5 MGLAWGLGVLFLMHVCGTNRIPESGGDNSVFDIFELTGAARKGSGRRLVKGPDPSSPAFR ..: : ::. . : ... .. :.. ::.: ... :: : . .::::. ::.: CCDS34 MVWRL-VLLALWVWPSTQAGHQDKDTT-FDLFSISNINRKTIGAKQFRGPDPGVPAYR 10 20 30 40 50 70 80 90 100 110 120 pF1KB5 IEDANLIPPVPDDKFQDLVDAVRAEKGFLLLASLRQMKKTRGTLLALERKDHSGQVFSVV . . :::: : .. .. .: ..::.: :.:.: :.:::::::: : . : .: CCDS34 FVRFDYIPPVNADDLSKITKIMRQKEGFFLTAQLKQDGKSRGTLLALEGPGLSQRQFEIV 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB5 SNGKAGTLDLSLTVQGKQHVVSVEEALLATGQWKSITLFVQEDRAQLYIDCEKMENAELD ::: : ::::. ..: .::::.:.. :: .:::..:. : . .:.. :. ... :: CCDS34 SNGPADTLDLTYWIDGTRHVVSLEDVGLADSQWKNVTVQVAGETYSLHVGCDLIDSFALD 120 130 140 150 160 170 190 200 210 220 230 pF1KB5 VPIQSVFTRDLASIARLRIAKGGVNDN-FQGVLQNVRFVFGTTPEDILRNKGCSSSTSVL :. . . : .:. .:::.. .. :.:.::::..:: .. :::: .:::... .. CCDS34 EPF---YEHLQAEKSRMYVAKGSARESHFRGLLQNVHLVFENSVEDILSKKGCQQGQGAE 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB5 LTL--DNNVVNGSSPAIRTNYIGHKTKDLQAICGISCDELSSMVLELRGLRTIVTTLQDS .. .:. . .: . :.:.: ... .: ::.::..:: :: ::...:. :... CCDS34 INAISENTETLRLGPHVTTEYVGPSSERRPEVCERSCEELGNMVQELSGLHVLVNQLSEN 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB5 IRKVTEENKELANELRRPP------LCYHNGVQYRNNEEWTVDSCTECHCQNSVTICKKV ...:...:. : . . :: :...: . .:: :.::::: : :.. :::... CCDS34 LKRVSNDNQFLWELIGGPPKTRNMSACWQDGRFFAENETWVVDSCTTCTCKKFKTICHQI 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB5 SCPIMPCSNATVPDGECCPRCWPSDSADDGWSPWSEWTSCSTSCGNGIQQRGRSCDSLNN .:: :.. . .::::: : : ....:::::.:::.::..::.: :::::::: .: CCDS34 TCPPATCASPSFVEGECCPSCLHSVDGEEGWSPWAEWTQCSVTCGSGTQQRGRSCDVTSN 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB5 RCEGSSVQTRTCHIQECDKRFKQDGGWSHWSPWSSCSVTCGDGVITRIRLCNSPSPQMNG : : :.:::.: ...:: :..::::::::::::::::::: : :::::::::: :::.: CCDS34 TCLGPSIQTRACSLSKCDTRIRQDGGWSHWSPWSSCSVTCGVGNITRIRLCNSPVPQMGG 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB5 KPCEGEARETKACKKDACPINGGWGPWSPWDICSVTCGGGVQKRSRLCNNPTPQFGGKDC : :.: .::::::. :::.: :.:::::. :.:::.::...:.:.::.: ::.::: : CCDS34 KNCKGSGRETKACQGAPCPIDGRWSPWSPWSACTVTCAGGIRERTRVCNSPEPQYGGKAC 480 490 500 510 520 530 540 550 560 570 580 590 pF1KB5 VGDVTENQICNKQDCPIDGCLSNPCFAGVKCTSYPDGSWKCGACPPGYSGNGIQCTDVDE :::: : :.:::..::.::::::::: :..:.:.:::::.::.:: :. ::: .: :.:: CCDS34 VGDVQERQMCNKRSCPVDGCLSNPCFPGAQCSSFPDGSWSCGSCPVGFLGNGTHCEDLDE 540 550 560 570 580 590 600 610 620 630 640 650 pF1KB5 CKEVPDACFNHNGEHRCENTDPGYNCLPCPPRFTGSQPFGQGVEHATANKQVCKPRNPCT : ::: ::. . :: ::.::..:::::::. :.:: : :.: : ..::::.:.::: CCDS34 CALVPDICFSTSKVPRCVNTQPGFHCLPCPPRYRGNQPVGVGLEAAKTEKQVCEPENPCK 600 610 620 630 640 650 660 670 680 690 700 710 pF1KB5 DGTHDCNKNAKCNYLGHYSDPMYRCECKPGYAGNGIICGEDTDLDGWPSENLVCVANATY : ::.:.:.:.: ::::.:::::.:::. ::::.:.:::::.::::::. ::::..:::: CCDS34 DKTHNCHKHAECIYLGHFSDPMYKCECQTGYAGDGLICGEDSDLDGWPNLNLVCATNATY 660 670 680 690 700 710 720 730 740 750 760 770 pF1KB5 HCKKDNCPNLPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPAQYDYDRDDVG :: :::::.::::::::.:::::::::::::::: . :..::: . .:: : :::.:.:: CCDS34 HCIKDNCPHLPNSGQEDFDKDGIGDACDDDDDNDGVTDEKDNCQLLFNPRQADYDKDEVG 720 730 740 750 760 770 780 790 800 810 820 830 pF1KB5 DRCDNCPYNHNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQRDTDMDGVGD :::::::: ::: : :::::::::::..::::: ..:::::: ::::.:::::: ::::: CCDS34 DRCDNCPYVHNPAQIDTDNNGEGDACSVDIDGDDVFNERDNCPYVYNTDQRDTDGDGVGD 780 790 800 810 820 830 840 850 860 870 880 890 pF1KB5 QCDNCPLEHNPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNANQADHDKDGKG .:::::: ::::: : :.: .:: ::::.:::.:::::: :::::. ::::::::.::.: CCDS34 HCDNCPLVHNPDQTDVDNDLVGDQCDNNEDIDDDGHQNNQDNCPYISNANQADHDRDGQG 840 850 860 870 880 890 900 910 920 930 940 950 pF1KB5 DACDHDDDNDGIPDDKDNCRLVPNPDQKDSDGDGRGDACKDDFDHDSVPDIDDICPENVD :::: ::::::.:::.:::::: ::::.: ::::::: ::::::.:..:::::.:::: CCDS34 DACDPDDDNDGVPDDRDNCRLVFNPDQEDLDGDGRGDICKDDFDNDNIPDIDDVCPENNA 900 910 920 930 940 950 960 970 980 990 1000 1010 pF1KB5 ISETDFRRFQMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLAVGYDEFNAVDFSGT ::::::: :::.:::::::.: :::::.::::::::::.: :::.:::.:::..:::::: CCDS34 ISETDFRNFQMVPLDPKGTTQIDPNWVIRHQGKELVQTANSDPGIAVGFDEFGSVDFSGT 960 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 pF1KB5 FFINTERDDDYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQGYSGLSVKVVNSTTG :..::.::::::::::::::::::::::::::::.::. .:::: ::::.:.:::::::: CCDS34 FYVNTDRDDDYAGFVFGYQSSSRFYVVMWKQVTQTYWEDQPTRAYGYSGVSLKVVNSTTG 1020 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 pF1KB5 PGEHLRNALWHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPKTGFIRVVMYEGKKI ::::::::::::::::::::::::::.:::::.:::::.:.::::::.:::...:::.. CCDS34 TGEHLRNALWHTGNTPGQVRTLWHDPRNIGWKDYTAYRWHLTHRPKTGYIRVLVHEGKQV 1080 1090 1100 1110 1120 1130 1140 1150 1160 1170 pF1KB5 MADSGPIYDKTYAGGRLGLFVFSQEMVFFSDLKYECRDP :::::::::.:::::::::::::::::.:::::::::: CCDS34 MADSGPIYDQTYAGGRLGLFVFSQEMVYFSDLKYECRDI 1140 1150 1160 1170 >>CCDS12385.1 COMP gene_id:1311|Hs108|chr19 (757 aa) initn: 2573 init1: 2171 opt: 2502 Z-score: 1746.5 bits: 334.5 E(32554): 5.9e-91 Smith-Waterman score: 2620; 53.6% identity (71.6% similar) in 666 aa overlap (547-1169:87-743) 520 530 540 550 560 570 pF1KB5 RLCNNPTPQFGGKDCVGDVTENQICNKQDCPIDGCLSNPCFAGVKCTSYPDGSWKCGACP :. : . :: :: : . .:. .:: :: CCDS12 REITFLKNTVMECDACGMQQSVRTGLPSVRPLLHCAPGFCFPGVACIQTESGA-RCGPCP 60 70 80 90 100 110 580 590 600 610 620 630 pF1KB5 PGYSGNGIQCTDVDECKEVPDACFNHNGEHRCENTDPGYNCLPCPPRFTGSQPFGQGVEH :..::: .::::.::. : :: . :: ::.::. : ::: ..: : :. CCDS12 AGFTGNGSHCTDVNECNAHP--CFPRV---RCINTSPGFRCEACPPGYSGPTHQGVGLAF 120 130 140 150 160 170 640 650 660 670 pF1KB5 ATANKQVCKPRNPCTDGTHDCNKNAKC-NYLGHYS------------------------- : :::::: : : : :.: :. : : : .. CCDS12 AKANKQVCTDINECETGQHNCVPNSVCINTRGSFQCGPCQPGFVGDQASGCQRRAQRFCP 180 190 200 210 220 230 680 690 700 710 pF1KB5 -----------------DPMYRCECKPGYAGNGIICGEDTDLDGWPSENLVCVANATYHC : : : :.:::::.::.::::::.:.:.: : .: CCDS12 DGSPSECHEHADCVLERDGSRSCVCAVGWAGNGILCGRDTDLDGFPDEKLRC---PERQC 240 250 260 270 280 720 730 740 750 760 770 pF1KB5 KKDNCPNLPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPAQYDYDRDDVGDR .:::: ..::::::: :.:::::::: : :.: .:...::::. :: : . :.: :: CCDS12 RKDNCVTVPNSGQEDVDRDGIGDACDPDADGDGVPNEKDNCPLVRNPDQRNTDEDKWGDA 290 300 310 320 330 340 780 790 800 810 820 830 pF1KB5 CDNCPYNHNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQRDTDMDGVGDQC :::: ..: :: :::..:.:::: ::::: : :. ::: : : ::.:.: ::.:: : CCDS12 CDNCRSQKNDDQKDTDQDGRGDACDDDIDGDRIRNQADNCPRVPNSDQKDSDGDGIGDAC 350 360 370 380 390 400 840 850 860 870 880 890 pF1KB5 DNCPLEHNPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNANQADHDKDGKGDA :::: . :::: : : : .::.::..:: : ::::.. :::: :::. : : :.::.::: CCDS12 DNCPQKSNPDQADVDHDFVGDACDSDQDQDGDGHQDSRDNCPTVPNSAQEDSDHDGQGDA 410 420 430 440 450 460 900 910 920 930 940 950 pF1KB5 CDHDDDNDGIPDDKDNCRLVPNPDQKDSDGDGRGDACKDDFDHDSVPDIDDICPENVDIS :: ::::::.::..::::::::: :.:.: :: ::.:.:::: :.: : :.::::.... CCDS12 CDDDDDNDGVPDSRDNCRLVPNPGQEDADRDGVGDVCQDDFDADKVVDKIDVCPENAEVT 470 480 490 500 510 520 960 970 980 990 1000 1010 pF1KB5 ETDFRRFQMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLAVGYDEFNAVDFSGTFF :::: :: . :::.: .: :::::: .::.:.:::.: :::::::: ::.::: ::: CCDS12 LTDFRAFQTVVLDPEGDAQIDPNWVVLNQGREIVQTMNSDPGLAVGYTAFNGVDFEGTFH 530 540 550 560 570 580 1020 1030 1040 1050 1060 1070 pF1KB5 INTERDDDYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQGYSGLSVKVVNSTTGPG .:: :::::::.::::.:: ::::::::. :.::..:: :: . :...:.:.:.:::: CCDS12 VNTVTDDDYAGFIFGYQDSSSFYVVMWKQMEQTYWQANPFRAVAEPGIQLKAVKSSTGPG 590 600 610 620 630 640 1080 1090 1100 1110 1120 1130 pF1KB5 EHLRNALWHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPKTGFIRVVMYEGKKIMA :.:::::::::.: .::: ::.:::..:::: .::: :.:::..:.::: .::: ...: CCDS12 EQLRNALWHTGDTESQVRLLWKDPRNVGWKDKKSYRWFLQHRPQVGYIRVRFYEGPELVA 650 660 670 680 690 700 1140 1150 1160 1170 pF1KB5 DSGPIYDKTYAGGRLGLFVFSQEMVFFSDLKYECRDP ::. . : :. :::::.: :::: .....:.:.: : CCDS12 DSNVVLDTTMRGGRLGVFCFSQENIIWANLRYRCNDTIPEDYETHQLRQA 710 720 730 740 750 >>CCDS58034.1 THBS3 gene_id:7059|Hs108|chr1 (836 aa) initn: 2130 init1: 1253 opt: 2422 Z-score: 1690.7 bits: 324.3 E(32554): 7.5e-88 Smith-Waterman score: 2575; 52.3% identity (71.4% similar) in 682 aa overlap (535-1169:143-818) 510 520 530 540 550 560 pF1KB5 SVTCGGGVQKRSRLCNNPTPQFGGKDCVGDVTENQICNKQDCPIDGCLSNPCFAGVKCTS . : :.:. .. . : :::: :: : CCDS58 TQLTLFNQILVELRDDIRDQVKEMSLIRNTIMECQVCGFHE-QRSHCSPNPCFRGVDCME 120 130 140 150 160 170 570 580 590 600 610 620 pF1KB5 -YPDGSWKCGACPPGYSGNGIQCTDVDECKEVPDACFNHNGEHRCENTDPGYNCLPCPPR : ...:: :::: .::: .:.:..:: .. : :: .. : :: ::..: :: CCDS58 VYEYPGYRCGPCPPGLQGNGTHCSDINECAHA-DPCFPGSS---CINTMPGFHCEACPRG 180 190 200 210 220 630 640 650 660 pF1KB5 FTGSQPFGQGVEHATANKQVCKPRNPCTDGTHD-CNKNAKCN--------------YLGH . :.: : :...: :.::::. . :.::.. :. :. :. .::. CCDS58 YKGTQVSGVGIDYARASKQVCNDIDECNDGNNGGCDPNSICTNTVGSFKCGPCRLGFLGN 230 240 250 260 270 280 670 680 690 700 pF1KB5 YSD----------PMYR-----------------CECKPGYAGNGIICGEDTDLDGWPSE :. : . :.:. :.:::: .:: :::.::.:.. CCDS58 QSQGCLPARTCHSPAHSPCHIHAHCLFERNGAVSCQCNVGWAGNGNVCGTDTDIDGYPDQ 290 300 310 320 330 340 710 720 730 740 750 760 pF1KB5 NLVCVANATYHCKKDNCPNLPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPA : :. : . :::.::: ::::::: :.::.:: :::: :.: : . .::: . : CCDS58 ALPCMDN-NKHCKQDNCLLTPNSGQEDADNDGVGDQCDDDADGDGIKNVEDNCRLFPNKD 350 360 370 380 390 400 770 780 790 800 810 820 pF1KB5 QYDYDRDDVGDRCDNCPYNHNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQ : . : :. :: ::::: : :: :::.::::::: :.::::: : ::: : : : CCDS58 QQNSDTDSFGDACDNCPNVPNNDQKDTDGNGEGDACDNDVDGDGIPNGLDNCPKVPNPLQ 410 420 430 440 450 460 830 840 850 860 870 880 pF1KB5 RDTDMDGVGDQCDNCPLEHNPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNAN : : ::::: ::.:: :: : :.::: .::.::.:.: : ::::.. :::: .::.. CCDS58 TDRDEDGVGDACDSCPEMSNPTQTDADSDLVGDVCDTNEDSDGDGHQDTKDNCPQLPNSS 470 480 490 500 510 520 890 900 910 920 930 pF1KB5 QADHDKDGKGDACDHDDDNDGIPD----DKDNCRLVPNPDQKDSDGDGRGDACKDDFDHD : : :.:: :: :: ::::::::: :::::::::.::::::.: ::.:.::::.: CCDS58 QLDSDNDGLGDECDGDDDNDGIPDYVPPGPDNCRLVPNPNQKDSDGNGVGDVCEDDFDND 530 540 550 560 570 580 940 950 960 970 980 990 pF1KB5 SVPDIDDICPENVDISETDFRRFQMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLA .: : :.:::..... :::: .: . :::.: .: :::::: .:: :.:::.: ::::: CCDS58 AVVDPLDVCPESAEVTLTDFRAYQTVVLDPEGDAQIDPNWVVLNQGMEIVQTMNSDPGLA 590 600 610 620 630 640 1000 1010 1020 1030 1040 1050 pF1KB5 VGYDEFNAVDFSGTFFINTERDDDYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQG ::: ::.::: ::: .:: :::::::.:.::.:.:::::::::. :.::...: :: . CCDS58 VGYTAFNGVDFEGTFHVNTVTDDDYAGFLFSYQDSGRFYVVMWKQTEQTYWQATPFRAVA 650 660 670 680 690 700 1060 1070 1080 1090 1100 1110 pF1KB5 YSGLSVKVVNSTTGPGEHLRNALWHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPK ::..:.:.:..::::::::::::::.:: ::: :: :::..::.: :.:::.: :::. CCDS58 QPGLQLKAVTSVSGPGEHLRNALWHTGHTPDQVRLLWTDPRNVGWRDKTSYRWQLLHRPQ 710 720 730 740 750 760 1120 1130 1140 1150 1160 1170 pF1KB5 TGFIRVVMYEGKKIMADSGPIYDKTYAGGRLGLFVFSQEMVFFSDLKYECRDP .:.::: .::: ...:::: : : .. :::::.: :::: ...:.:.:.: : CCDS58 VGYIRVKLYEGPQLVADSGVIIDTSMRGGRLGVFCFSQENIIWSNLQYRCNDTVPEDFEP 770 780 790 800 810 820 CCDS58 FRRQLLQGRV 830 >>CCDS72937.1 THBS3 gene_id:7059|Hs108|chr1 (947 aa) initn: 2130 init1: 1253 opt: 2422 Z-score: 1690.2 bits: 324.4 E(32554): 8e-88 Smith-Waterman score: 2575; 52.3% identity (71.4% similar) in 682 aa overlap (535-1169:254-929) 510 520 530 540 550 560 pF1KB5 SVTCGGGVQKRSRLCNNPTPQFGGKDCVGDVTENQICNKQDCPIDGCLSNPCFAGVKCTS . : :.:. .. . : :::: :: : CCDS72 TQLTLFNQILVELRDDIRDQVKEMSLIRNTIMECQVCGFHE-QRSHCSPNPCFRGVDCME 230 240 250 260 270 280 570 580 590 600 610 620 pF1KB5 -YPDGSWKCGACPPGYSGNGIQCTDVDECKEVPDACFNHNGEHRCENTDPGYNCLPCPPR : ...:: :::: .::: .:.:..:: .. : :: .. : :: ::..: :: CCDS72 VYEYPGYRCGPCPPGLQGNGTHCSDINECAHA-DPCFPGSS---CINTMPGFHCEACPRG 290 300 310 320 330 630 640 650 660 pF1KB5 FTGSQPFGQGVEHATANKQVCKPRNPCTDGTHD-CNKNAKCN--------------YLGH . :.: : :...: :.::::. . :.::.. :. :. :. .::. CCDS72 YKGTQVSGVGIDYARASKQVCNDIDECNDGNNGGCDPNSICTNTVGSFKCGPCRLGFLGN 340 350 360 370 380 390 670 680 690 700 pF1KB5 YSD----------PMYR-----------------CECKPGYAGNGIICGEDTDLDGWPSE :. : . :.:. :.:::: .:: :::.::.:.. CCDS72 QSQGCLPARTCHSPAHSPCHIHAHCLFERNGAVSCQCNVGWAGNGNVCGTDTDIDGYPDQ 400 410 420 430 440 450 710 720 730 740 750 760 pF1KB5 NLVCVANATYHCKKDNCPNLPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPA : :. : . :::.::: ::::::: :.::.:: :::: :.: : . .::: . : CCDS72 ALPCMDN-NKHCKQDNCLLTPNSGQEDADNDGVGDQCDDDADGDGIKNVEDNCRLFPNKD 460 470 480 490 500 510 770 780 790 800 810 820 pF1KB5 QYDYDRDDVGDRCDNCPYNHNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQ : . : :. :: ::::: : :: :::.::::::: :.::::: : ::: : : : CCDS72 QQNSDTDSFGDACDNCPNVPNNDQKDTDGNGEGDACDNDVDGDGIPNGLDNCPKVPNPLQ 520 530 540 550 560 570 830 840 850 860 870 880 pF1KB5 RDTDMDGVGDQCDNCPLEHNPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNAN : : ::::: ::.:: :: : :.::: .::.::.:.: : ::::.. :::: .::.. CCDS72 TDRDEDGVGDACDSCPEMSNPTQTDADSDLVGDVCDTNEDSDGDGHQDTKDNCPQLPNSS 580 590 600 610 620 630 890 900 910 920 930 pF1KB5 QADHDKDGKGDACDHDDDNDGIPD----DKDNCRLVPNPDQKDSDGDGRGDACKDDFDHD : : :.:: :: :: ::::::::: :::::::::.::::::.: ::.:.::::.: CCDS72 QLDSDNDGLGDECDGDDDNDGIPDYVPPGPDNCRLVPNPNQKDSDGNGVGDVCEDDFDND 640 650 660 670 680 690 940 950 960 970 980 990 pF1KB5 SVPDIDDICPENVDISETDFRRFQMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLA .: : :.:::..... :::: .: . :::.: .: :::::: .:: :.:::.: ::::: CCDS72 AVVDPLDVCPESAEVTLTDFRAYQTVVLDPEGDAQIDPNWVVLNQGMEIVQTMNSDPGLA 700 710 720 730 740 750 1000 1010 1020 1030 1040 1050 pF1KB5 VGYDEFNAVDFSGTFFINTERDDDYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQG ::: ::.::: ::: .:: :::::::.:.::.:.:::::::::. :.::...: :: . CCDS72 VGYTAFNGVDFEGTFHVNTVTDDDYAGFLFSYQDSGRFYVVMWKQTEQTYWQATPFRAVA 760 770 780 790 800 810 1060 1070 1080 1090 1100 1110 pF1KB5 YSGLSVKVVNSTTGPGEHLRNALWHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPK ::..:.:.:..::::::::::::::.:: ::: :: :::..::.: :.:::.: :::. CCDS72 QPGLQLKAVTSVSGPGEHLRNALWHTGHTPDQVRLLWTDPRNVGWRDKTSYRWQLLHRPQ 820 830 840 850 860 870 1120 1130 1140 1150 1160 1170 pF1KB5 TGFIRVVMYEGKKIMADSGPIYDKTYAGGRLGLFVFSQEMVFFSDLKYECRDP .:.::: .::: ...:::: : : .. :::::.: :::: ...:.:.:.: : CCDS72 VGYIRVKLYEGPQLVADSGVIIDTSMRGGRLGVFCFSQENIIWSNLQYRCNDTVPEDFEP 880 890 900 910 920 930 CCDS72 FRRQLLQGRV 940 >>CCDS1099.1 THBS3 gene_id:7059|Hs108|chr1 (956 aa) initn: 2130 init1: 1253 opt: 2422 Z-score: 1690.1 bits: 324.4 E(32554): 8.1e-88 Smith-Waterman score: 2575; 52.3% identity (71.4% similar) in 682 aa overlap (535-1169:263-938) 510 520 530 540 550 560 pF1KB5 SVTCGGGVQKRSRLCNNPTPQFGGKDCVGDVTENQICNKQDCPIDGCLSNPCFAGVKCTS . : :.:. .. . : :::: :: : CCDS10 TQLTLFNQILVELRDDIRDQVKEMSLIRNTIMECQVCGFHE-QRSHCSPNPCFRGVDCME 240 250 260 270 280 290 570 580 590 600 610 620 pF1KB5 -YPDGSWKCGACPPGYSGNGIQCTDVDECKEVPDACFNHNGEHRCENTDPGYNCLPCPPR : ...:: :::: .::: .:.:..:: .. : :: .. : :: ::..: :: CCDS10 VYEYPGYRCGPCPPGLQGNGTHCSDINECAHA-DPCFPGSS---CINTMPGFHCEACPRG 300 310 320 330 340 630 640 650 660 pF1KB5 FTGSQPFGQGVEHATANKQVCKPRNPCTDGTHD-CNKNAKCN--------------YLGH . :.: : :...: :.::::. . :.::.. :. :. :. .::. CCDS10 YKGTQVSGVGIDYARASKQVCNDIDECNDGNNGGCDPNSICTNTVGSFKCGPCRLGFLGN 350 360 370 380 390 400 670 680 690 700 pF1KB5 YSD----------PMYR-----------------CECKPGYAGNGIICGEDTDLDGWPSE :. : . :.:. :.:::: .:: :::.::.:.. CCDS10 QSQGCLPARTCHSPAHSPCHIHAHCLFERNGAVSCQCNVGWAGNGNVCGTDTDIDGYPDQ 410 420 430 440 450 460 710 720 730 740 750 760 pF1KB5 NLVCVANATYHCKKDNCPNLPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPA : :. : . :::.::: ::::::: :.::.:: :::: :.: : . .::: . : CCDS10 ALPCMDN-NKHCKQDNCLLTPNSGQEDADNDGVGDQCDDDADGDGIKNVEDNCRLFPNKD 470 480 490 500 510 520 770 780 790 800 810 820 pF1KB5 QYDYDRDDVGDRCDNCPYNHNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQ : . : :. :: ::::: : :: :::.::::::: :.::::: : ::: : : : CCDS10 QQNSDTDSFGDACDNCPNVPNNDQKDTDGNGEGDACDNDVDGDGIPNGLDNCPKVPNPLQ 530 540 550 560 570 580 830 840 850 860 870 880 pF1KB5 RDTDMDGVGDQCDNCPLEHNPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNAN : : ::::: ::.:: :: : :.::: .::.::.:.: : ::::.. :::: .::.. CCDS10 TDRDEDGVGDACDSCPEMSNPTQTDADSDLVGDVCDTNEDSDGDGHQDTKDNCPQLPNSS 590 600 610 620 630 640 890 900 910 920 930 pF1KB5 QADHDKDGKGDACDHDDDNDGIPD----DKDNCRLVPNPDQKDSDGDGRGDACKDDFDHD : : :.:: :: :: ::::::::: :::::::::.::::::.: ::.:.::::.: CCDS10 QLDSDNDGLGDECDGDDDNDGIPDYVPPGPDNCRLVPNPNQKDSDGNGVGDVCEDDFDND 650 660 670 680 690 700 940 950 960 970 980 990 pF1KB5 SVPDIDDICPENVDISETDFRRFQMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLA .: : :.:::..... :::: .: . :::.: .: :::::: .:: :.:::.: ::::: CCDS10 AVVDPLDVCPESAEVTLTDFRAYQTVVLDPEGDAQIDPNWVVLNQGMEIVQTMNSDPGLA 710 720 730 740 750 760 1000 1010 1020 1030 1040 1050 pF1KB5 VGYDEFNAVDFSGTFFINTERDDDYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQG ::: ::.::: ::: .:: :::::::.:.::.:.:::::::::. :.::...: :: . CCDS10 VGYTAFNGVDFEGTFHVNTVTDDDYAGFLFSYQDSGRFYVVMWKQTEQTYWQATPFRAVA 770 780 790 800 810 820 1060 1070 1080 1090 1100 1110 pF1KB5 YSGLSVKVVNSTTGPGEHLRNALWHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPK ::..:.:.:..::::::::::::::.:: ::: :: :::..::.: :.:::.: :::. CCDS10 QPGLQLKAVTSVSGPGEHLRNALWHTGHTPDQVRLLWTDPRNVGWRDKTSYRWQLLHRPQ 830 840 850 860 870 880 1120 1130 1140 1150 1160 1170 pF1KB5 TGFIRVVMYEGKKIMADSGPIYDKTYAGGRLGLFVFSQEMVFFSDLKYECRDP .:.::: .::: ...:::: : : .. :::::.: :::: ...:.:.:.: : CCDS10 VGYIRVKLYEGPQLVADSGVIIDTSMRGGRLGVFCFSQENIIWSNLQYRCNDTVPEDFEP 890 900 910 920 930 940 CCDS10 FRRQLLQGRV 950 >>CCDS78027.1 THBS4 gene_id:7060|Hs108|chr5 (870 aa) initn: 2483 init1: 1214 opt: 2364 Z-score: 1650.4 bits: 316.9 E(32554): 1.3e-85 Smith-Waterman score: 2510; 53.9% identity (69.9% similar) in 668 aa overlap (547-1169:195-851) 520 530 540 550 560 570 pF1KB5 RLCNNPTPQFGGKDCVGDVTENQICNKQDCPIDGCLSNPCFAGVKCTSYPDGSWKCGACP : : ::::: ::.::. :: ..:: :: CCDS78 AECQACGPLKFQSPTPSTVVPPAPPAPPTRPPRRCDSNPCFRGVQCTDSRDG-FQCGPCP 170 180 190 200 210 220 580 590 600 610 620 630 pF1KB5 PGYSGNGIQCTDVDECKEVPDACFNHNGEHRCENTDPGYNCLPCPPRFTGSQPFGQGVEH ::.:::: : :::::: : :. : : : : .::. : :: ::: . : :. CCDS78 EGYTGNGITCIDVDECKYHP--CYP--GVH-CINLSPGFRCDACPVGFTGPMVQGVGISF 230 240 250 260 270 640 650 660 670 pF1KB5 ATANKQVCKPRNPCTDGTHDCNKNAKC-NYLGHYS----DPMYR---------------- : .::::: . : .:. : :. : : :: : : : CCDS78 AKSNKQVCTDIDECRNGA--CVPNSICVNTLGSYRCGPCKPGYTGDQIRGCKAERNCRNP 280 290 300 310 320 330 680 690 700 710 pF1KB5 --------------------CECKPGYAGNGIICGEDTDLDGWPSENLVCVANATYHCKK : : :.::.: :::.:.:.:..:.:.: : : .::: CCDS78 ELNPCSVNAQCIEERQGDVTCVCGVGWAGDGYICGKDVDIDSYPDEELPCSA---RNCKK 340 350 360 370 380 390 720 730 740 750 760 770 pF1KB5 DNCPNLPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPAQYDYDRDDVGDRCD ::: .::::::: :.::::::::.: :.: : ...::: . .: : . :.: :: :: CCDS78 DNCKYVPNSGQEDADRDGIGDACDEDADGDGILNEQDNCVLIHNVDQRNSDKDIFGDACD 400 410 420 430 440 450 780 790 800 810 820 830 pF1KB5 NCPYNHNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQRDTDMDGVGDQCDN :: : :: :::..:.:::: :.::::: : ::: : :::: : ::::: ::. CCDS78 NCLSVLNNDQKDTDGDGRGDACDDDMDGDGIKNILDNCPKFPNRDQRDKDGDGVGDACDS 460 470 480 490 500 510 840 850 860 870 880 890 pF1KB5 CPLEHNPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNANQADHDKDGKGDACD :: ::.: : :.: .::.::.::: : ::::.. :::: : :. : : :::: :: :: CCDS78 CPDVSNPNQSDVDNDLVGDSCDTNQDSDGDGHQDSTDNCPTVINSAQLDTDKDGIGDECD 520 530 540 550 560 570 900 910 920 930 940 950 pF1KB5 HDDDNDGIPD----DKDNCRLVPNPDQKDSDGDGRGDACKDDFDHDSVPDIDDICPENVD ::::::::: ::::::::: :.::..:: :: :..:::.:.: : :.::::.. CCDS78 DDDDNDGIPDLVPPGPDNCRLVPNPAQEDSNSDGVGDICESDFDQDQVIDRIDVCPENAE 580 590 600 610 620 630 960 970 980 990 1000 1010 pF1KB5 ISETDFRRFQMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLAVGYDEFNAVDFSGT .. :::: .: . :::.: .: :::::: .:: :.:::.: :::::::: ::.::: :: CCDS78 VTLTDFRAYQTVVLDPEGDAQIDPNWVVLNQGMEIVQTMNSDPGLAVGYTAFNGVDFEGT 640 650 660 670 680 690 1020 1030 1040 1050 1060 1070 pF1KB5 FFINTERDDDYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQGYSGLSVKVVNSTTG : .::. :::::::.::::.:: ::::::::. :.::...: :: . :...:.:.: :: CCDS78 FHVNTQTDDDYAGFIFGYQDSSSFYVVMWKQTEQTYWQATPFRAVAEPGIQLKAVKSKTG 700 710 720 730 740 750 1080 1090 1100 1110 1120 1130 pF1KB5 PGEHLRNALWHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPKTGFIRVVMYEGKKI :::::::.:::::.: ::: ::.: :..:::: ..::: :.:::..:.::: .:::... CCDS78 PGEHLRNSLWHTGDTSDQVRLLWKDSRNVGWKDKVSYRWFLQHRPQVGYIRVRFYEGSEL 760 770 780 790 800 810 1140 1150 1160 1170 pF1KB5 MADSGPIYDKTYAGGRLGLFVFSQEMVFFSDLKYECRDP .:::: : :. :::::.: :::: ...:.:::.: : CCDS78 VADSGVTIDTTMRGGRLGVFCFSQENIIWSNLKYRCNDTIPEDFQEFQTQNFDRFDN 820 830 840 850 860 870 >>CCDS4049.1 THBS4 gene_id:7060|Hs108|chr5 (961 aa) initn: 2483 init1: 1214 opt: 2364 Z-score: 1650.0 bits: 317.0 E(32554): 1.4e-85 Smith-Waterman score: 2510; 53.9% identity (69.9% similar) in 668 aa overlap (547-1169:286-942) 520 530 540 550 560 570 pF1KB5 RLCNNPTPQFGGKDCVGDVTENQICNKQDCPIDGCLSNPCFAGVKCTSYPDGSWKCGACP : : ::::: ::.::. :: ..:: :: CCDS40 AECQACGPLKFQSPTPSTVVPPAPPAPPTRPPRRCDSNPCFRGVQCTDSRDG-FQCGPCP 260 270 280 290 300 310 580 590 600 610 620 630 pF1KB5 PGYSGNGIQCTDVDECKEVPDACFNHNGEHRCENTDPGYNCLPCPPRFTGSQPFGQGVEH ::.:::: : :::::: : :. : : : : .::. : :: ::: . : :. CCDS40 EGYTGNGITCIDVDECKYHP--CYP--GVH-CINLSPGFRCDACPVGFTGPMVQGVGISF 320 330 340 350 360 640 650 660 670 pF1KB5 ATANKQVCKPRNPCTDGTHDCNKNAKC-NYLGHYS----DPMYR---------------- : .::::: . : .:. : :. : : :: : : : CCDS40 AKSNKQVCTDIDECRNGA--CVPNSICVNTLGSYRCGPCKPGYTGDQIRGCKAERNCRNP 370 380 390 400 410 420 680 690 700 710 pF1KB5 --------------------CECKPGYAGNGIICGEDTDLDGWPSENLVCVANATYHCKK : : :.::.: :::.:.:.:..:.:.: : : .::: CCDS40 ELNPCSVNAQCIEERQGDVTCVCGVGWAGDGYICGKDVDIDSYPDEELPCSA---RNCKK 430 440 450 460 470 480 720 730 740 750 760 770 pF1KB5 DNCPNLPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYNPAQYDYDRDDVGDRCD ::: .::::::: :.::::::::.: :.: : ...::: . .: : . :.: :: :: CCDS40 DNCKYVPNSGQEDADRDGIGDACDEDADGDGILNEQDNCVLIHNVDQRNSDKDIFGDACD 490 500 510 520 530 540 780 790 800 810 820 830 pF1KB5 NCPYNHNPDQADTDNNGEGDACAADIDGDGILNERDNCQYVYNVDQRDTDMDGVGDQCDN :: : :: :::..:.:::: :.::::: : ::: : :::: : ::::: ::. CCDS40 NCLSVLNNDQKDTDGDGRGDACDDDMDGDGIKNILDNCPKFPNRDQRDKDGDGVGDACDS 550 560 570 580 590 600 840 850 860 870 880 890 pF1KB5 CPLEHNPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNANQADHDKDGKGDACD :: ::.: : :.: .::.::.::: : ::::.. :::: : :. : : :::: :: :: CCDS40 CPDVSNPNQSDVDNDLVGDSCDTNQDSDGDGHQDSTDNCPTVINSAQLDTDKDGIGDECD 610 620 630 640 650 660 900 910 920 930 940 950 pF1KB5 HDDDNDGIPD----DKDNCRLVPNPDQKDSDGDGRGDACKDDFDHDSVPDIDDICPENVD ::::::::: ::::::::: :.::..:: :: :..:::.:.: : :.::::.. CCDS40 DDDDNDGIPDLVPPGPDNCRLVPNPAQEDSNSDGVGDICESDFDQDQVIDRIDVCPENAE 670 680 690 700 710 720 960 970 980 990 1000 1010 pF1KB5 ISETDFRRFQMIPLDPKGTSQNDPNWVVRHQGKELVQTVNCDPGLAVGYDEFNAVDFSGT .. :::: .: . :::.: .: :::::: .:: :.:::.: :::::::: ::.::: :: CCDS40 VTLTDFRAYQTVVLDPEGDAQIDPNWVVLNQGMEIVQTMNSDPGLAVGYTAFNGVDFEGT 730 740 750 760 770 780 1020 1030 1040 1050 1060 1070 pF1KB5 FFINTERDDDYAGFVFGYQSSSRFYVVMWKQVTQSYWDTNPTRAQGYSGLSVKVVNSTTG : .::. :::::::.::::.:: ::::::::. :.::...: :: . :...:.:.: :: CCDS40 FHVNTQTDDDYAGFIFGYQDSSSFYVVMWKQTEQTYWQATPFRAVAEPGIQLKAVKSKTG 790 800 810 820 830 840 1080 1090 1100 1110 1120 1130 pF1KB5 PGEHLRNALWHTGNTPGQVRTLWHDPRHIGWKDFTAYRWRLSHRPKTGFIRVVMYEGKKI :::::::.:::::.: ::: ::.: :..:::: ..::: :.:::..:.::: .:::... CCDS40 PGEHLRNSLWHTGDTSDQVRLLWKDSRNVGWKDKVSYRWFLQHRPQVGYIRVRFYEGSEL 850 860 870 880 890 900 1140 1150 1160 1170 pF1KB5 MADSGPIYDKTYAGGRLGLFVFSQEMVFFSDLKYECRDP .:::: : :. :::::.: :::: ...:.:::.: : CCDS40 VADSGVTIDTTMRGGRLGVFCFSQENIIWSNLKYRCNDTIPEDFQEFQTQNFDRFDN 910 920 930 940 950 960 >>CCDS30956.1 HMCN1 gene_id:83872|Hs108|chr1 (5635 aa) initn: 1339 init1: 525 opt: 705 Z-score: 495.0 bits: 105.8 E(32554): 3e-21 Smith-Waterman score: 726; 26.7% identity (50.7% similar) in 716 aa overlap (62-725:4182-4849) 40 50 60 70 80 90 pF1KB5 DIFELTGAARKGSGRRLVKGPDPSSPAFRIEDANLIPPVPDDKFQDLVDAVRAEKGFLLL :... : : : . . :. .: .:: CCDS30 NVAGSSSTSTKLTVHVPPRIRSTEGHYTVNENSQAILPCVADGIP--TPAINWKKDNVLL 4160 4170 4180 4190 4200 100 110 120 130 140 pF1KB5 ASL--RQMKKTRGTLLALERKDHSGQVFSVVSNGKAG--TLDLSLTVQGKQHVVSVEEAL :.: . . : :. . ... .. :.:. :: : .:::: ::. . : CCDS30 ANLLGKYTAEPYGELILENVVLEDSGFYTCVANNAAGEDTHTVSLTV----HVLPTFTEL 4210 4220 4230 4240 4250 4260 150 160 170 180 190 200 pF1KB5 ---LATGQWKSITLFVQEDRAQLYIDCEKMENAELDVPIQSVFTRDLASIARLRIAKGGV .. .. ... : . : ..: . . ..:: .. : :. .:. CCDS30 PGDVSLNKGEQLRLSCKATGIPLPKLTWTFNNNIIPAHFDSVNGHSELVIERVSKEDSGT 4270 4280 4290 4300 4310 4320 210 220 230 240 250 pF1KB5 ----NDNFQGVLQNVRFVFGTTPEDILRNKGCSSSTSVL---LTLDNNVVNGSSPAIRTN .: : .. . ::. : .... :. : :. .: . .:.:. : CCDS30 YVCTAENSVGFVKAIGFVYVKEPP-VFKGDYPSNWIEPLGGNAILNCEVKGDPTPTIQWN 4330 4340 4350 4360 4370 4380 260 270 280 290 300 pF1KB5 YIG------HKTKDLQ----AICG-ISCD--ELSSMVLELRGL--RTIVTTLQDSIRKVT : :. ..: :: : .. : . . .. . :. :.. :::. . CCDS30 RKGVDIEISHRIRQLGNGSLAIYGTVNEDAGDYTCVATNEAGVVERSMSLTLQSPPIITL 4390 4400 4410 4420 4430 4440 310 320 330 340 350 360 pF1KB5 EENKELANELRRPPL-CYHNGVQYRNNEEWTVDSCTECHCQNSVTICKKVSCPIMPCSNA : . . : . : : .: . . . :. .. . .. :.. .. : : .. CCDS30 EPVETVINAGGKIILNCQATG-EPQPTITWSRQGHSISW-DDRVNVLSNNSLYIADAQKE 4450 4460 4470 4480 4490 4500 370 380 390 400 pF1KB5 TVPDGECCPRCWPSD---------SADDGWSPWSEWTSCSTSCGNGIQQRGRSCD----- . . :: : .. .. :.: :: : .::..::.:::.:.: :. CCDS30 DTSEFECVARNLMGSVLVRVPVIVQVHGGFSQWSAWRACSVTCGKGIQKRSRLCNQPLPA 4510 4520 4530 4540 4550 4560 410 420 430 440 450 460 pF1KB5 SLNNRCEGSSVQTRTCHIQECDKRFKQDGGWSHWSPWSSCSVTCGDGVITRIRLCNSPSP . .. :.::... :.:. . : ::.::.:: : :. .:: : :: : ::.:: CCDS30 NGGKPCQGSDLEMRNCQNKPCPV----DGSWSEWSLWEECTRSCGRGNQTRTRTCNNPSV 4570 4580 4590 4600 4610 470 480 490 500 510 520 pF1KB5 QMNGKPCEGEARETKACKKDACPINGGWGPWSPWDICSVTCGGGVQKRSRLCNNPTPQFG : .:.::::.: : :. ::..:.:. :.:: :: .:: :.: :.:::::: : :: CCDS30 QHGGRPCEGNAVEIIMCNIRPCPVHGAWSAWQPWGTCSESCGKGTQTRARLCNNPPPAFG 4620 4630 4640 4650 4660 4670 530 540 550 560 570 580 pF1KB5 GKDCVGDVTENQICNKQDCPIDGCLSNPCFAGVKCTSYPDGSWK-CG-ACPPGYSGNGIQ :. : : :. :.::...::: : : ... .::. :. .: : CCDS30 GSYCDGAETQMQVCNERNCPIHG----------KWATW--ASWSACSVSCGGGARQRTRG 4680 4690 4700 4710 4720 590 600 610 620 630 640 pF1KB5 CTDVDECKEVPDACFNHNGEHRCENTDPGY---NCLPCPPRFTGSQPFGQGVEHATANKQ :.: :: . : ..::..: : ::: . . : : :. : : CCDS30 CSD-----PVP-----QYGGRKCEGSDVQSDFCNSDPCPTHGNWSPWSGWGTCSRTCNGG 4730 4740 4750 4760 4770 650 660 670 680 690 700 pF1KB5 VCKPRNPCTDGTHDCNKNAKCNYLGHYSDPMYRCECKPGYAGNGIICGEDTDLDGWPSEN . : :. : . : : .. . :: : .: : . .: : . CCDS30 QMRRYRTC-DNPPPSNGGRAC---GGPDSQIQRC--------NTDMCPVDGSWGSWHSWS 4780 4790 4800 4810 4820 710 720 730 740 750 pF1KB5 LVCVAN--ATYHCKKDNCPN-LPNSGQEDYDKDGIGDACDDDDDNDKIPDDRDNCPFHYN : :. . . .: : . .: .: CCDS30 Q-CSASCGGGEKTRKRLCDHPVPVKGGRPCPGDTTQVTRCNVQACPGGPQRARGSVIGNI 4830 4840 4850 4860 4870 4880 >>CCDS64985.1 ADGRB1 gene_id:575|Hs108|chr8 (1584 aa) initn: 536 init1: 253 opt: 601 Z-score: 428.8 bits: 91.7 E(32554): 1.5e-17 Smith-Waterman score: 601; 35.2% identity (55.3% similar) in 273 aa overlap (329-591:358-620) 300 310 320 330 340 350 pF1KB5 RKVTEENKELANELRRPPLCYHNGVQYRNNEEWTVDSCTECHC----QNSVTICKKVSCP :::. : : :. . .: . : CCDS64 RSTDARRREELGDELQQFGFPAPQTGDPAAEEWSPWSVCSSTCGEGWQTRTRFCVSSSYS 330 340 350 360 370 380 360 370 380 390 400 410 pF1KB5 IMPCSNATVPDGECCPR--CWPSDSADDGWSPWSEWTSCSTSCGNGIQQRGRSCDSLN-- . ::. . : : : .: :. :: :. ::..:: :...: :.: . CCDS64 TQ-CSGPLREQRLCNNSAVC-PVHGA---WDEWSPWSLCSSTCGRGFRDRTRTCRPPQFG 390 400 410 420 430 440 420 430 440 450 460 pF1KB5 -NRCEGSSVQTRTCHIQECDKRFKQDGGWSHWSPWSSCSVTCGDGVITRIRLCNSPSPQM : ::: ::. :.: : : ::.:..:: ::.::..:..: : : ::.:: . CCDS64 GNPCEGPEKQTKFCNIALCPGR-AVDGNWNEWSSWSACSASCSQGRQQRTRECNGPS--Y 450 460 470 480 490 470 480 490 500 510 520 pF1KB5 NGKPCEGEARETKACKKDACPINGGWGPWSPWDICSVTCGGGVQKRSRLCNNPTPQFGGK .: :.:. ::. : . ::..: : :. : ::::::.: :.: :.:..: ::: CCDS64 GGAECQGHWVETRDCFLQQCPVDGKWQAWASWGSCSVTCGAGSQRRERVCSGPF--FGGA 500 510 520 530 540 550 530 540 550 560 570 580 pF1KB5 DCVGDVTENQICNKQDCPIDGCLSNP-CFAGVKCTSYPDGSWKCGACPPGYSGNGIQCTD : : : . :. : :: . . :..: : : :: . .: .. . CCDS64 ACQGPQDEYRQCGTQRCPEPHEICDEDNFGAVIWKETPAGEVAAVRCPRNATGLILRRCE 560 570 580 590 600 610 590 600 610 620 630 640 pF1KB5 VDECKEVPDACFNHNGEHRCENTDPGYNCLPCPPRFTGSQPFGQGVEHATANKQVCKPRN .:: CCDS64 LDEEGIAYWEPPTYIRCVSIDYRNIQMMTREHLAKAQRGLPGEGVSEVIQTLVEISQDGT 620 630 640 650 660 670 1170 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 22:44:20 2016 done: Thu Nov 3 22:44:21 2016 Total Scan time: 5.010 Total Display time: 0.390 Function used was FASTA [36.3.4 Apr, 2011]