FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB3124, 556 aa 1>>>pF1KB3124 556 - 556 aa - 556 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.8731+/-0.000864; mu= 16.1255+/- 0.052 mean_var=75.2612+/-14.777, 0's: 0 Z-trim(106.9): 13 B-trim: 78 in 1/51 Lambda= 0.147839 statistics sampled from 9253 (9263) to 9253 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.655), E-opt: 0.2 (0.285), width: 16 Scan time: 3.140 The best scores are: opt bits E(32554) CCDS14637.1 GPC4 gene_id:2239|Hs108|chrX ( 556) 3749 809.1 0 CCDS9469.1 GPC6 gene_id:10082|Hs108|chr13 ( 555) 2422 526.1 4.2e-149 CCDS5689.1 GPC2 gene_id:221914|Hs108|chr7 ( 579) 1387 305.4 1.3e-82 CCDS2534.1 GPC1 gene_id:2817|Hs108|chr2 ( 558) 1158 256.5 6.1e-68 CCDS9468.1 GPC5 gene_id:2262|Hs108|chr13 ( 572) 712 161.4 2.7e-39 CCDS14638.1 GPC3 gene_id:2719|Hs108|chrX ( 580) 591 135.6 1.6e-31 CCDS55496.1 GPC3 gene_id:2719|Hs108|chrX ( 603) 523 121.1 3.9e-27 CCDS55495.1 GPC3 gene_id:2719|Hs108|chrX ( 526) 456 106.8 6.9e-23 >>CCDS14637.1 GPC4 gene_id:2239|Hs108|chrX (556 aa) initn: 3749 init1: 3749 opt: 3749 Z-score: 4319.9 bits: 809.1 E(32554): 0 Smith-Waterman score: 3749; 100.0% identity (100.0% similar) in 556 aa overlap (1-556:1-556) 10 20 30 40 50 60 pF1KB3 MARFGLPALLCTLAVLSAALLAAELKSKSCSEVRRLYVSKGFNKNDAPLHEINGDHLKIC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MARFGLPALLCTLAVLSAALLAAELKSKSCSEVRRLYVSKGFNKNDAPLHEINGDHLKIC 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 PQGSTCCSQEMEEKYSLQSKDDFKSVVSEQCNHLQAVFASRYKKFDEFFKELLENAEKSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 PQGSTCCSQEMEEKYSLQSKDDFKSVVSEQCNHLQAVFASRYKKFDEFFKELLENAEKSL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 NDMFVKTYGHLYMQNSELFKDLFVELKRYYVVGNVNLEEMLNDFWARLLERMFRLVNSQY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 NDMFVKTYGHLYMQNSELFKDLFVELKRYYVVGNVNLEEMLNDFWARLLERMFRLVNSQY 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 HFTDEYLECVSKYTEQLKPFGDVPRKLKLQVTRAFVAARTFAQGLAVAGDVVSKVSVVNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 HFTDEYLECVSKYTEQLKPFGDVPRKLKLQVTRAFVAARTFAQGLAVAGDVVSKVSVVNP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB3 TAQCTHALLKMIYCSHCRGLVTVKPCYNYCSNIMRGCLANQGDLDFEWNNFIDAMLMVAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 TAQCTHALLKMIYCSHCRGLVTVKPCYNYCSNIMRGCLANQGDLDFEWNNFIDAMLMVAE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB3 RLEGPFNIESVMDPIDVKISDAIMNMQDNSVQVSQKVFQGCGPPKPLPAGRISRSISESA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 RLEGPFNIESVMDPIDVKISDAIMNMQDNSVQVSQKVFQGCGPPKPLPAGRISRSISESA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB3 FSARFRPHHPEERPTTAAGTSLDRLVTDVKEKLKQAKKFWSSLPSNVCNDERMAAGNGNE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 FSARFRPHHPEERPTTAAGTSLDRLVTDVKEKLKQAKKFWSSLPSNVCNDERMAAGNGNE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB3 DDCWNGKGKSRYLFAVTGNGLANQGNNPEVQVDTSKPDILILRQIMALRVMTSKMKNAYN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 DDCWNGKGKSRYLFAVTGNGLANQGNNPEVQVDTSKPDILILRQIMALRVMTSKMKNAYN 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB3 GNDVDFFDISDESSGEGSGSGCEYQQCPSEFDYNATDHAGKSANEKADSAGVRPGAQAYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 GNDVDFFDISDESSGEGSGSGCEYQQCPSEFDYNATDHAGKSANEKADSAGVRPGAQAYL 490 500 510 520 530 540 550 pF1KB3 LTVFCILFLVMQREWR :::::::::::::::: CCDS14 LTVFCILFLVMQREWR 550 >>CCDS9469.1 GPC6 gene_id:10082|Hs108|chr13 (555 aa) initn: 2398 init1: 1676 opt: 2422 Z-score: 2790.3 bits: 526.1 E(32554): 4.2e-149 Smith-Waterman score: 2422; 64.8% identity (85.6% similar) in 549 aa overlap (6-553:10-552) 10 20 30 40 50 pF1KB3 MARFGLPALLCTLAVLSAALLAAELKSKSCSEVRRLYVSKGFNKNDAPLHEINGDH :: :: : : :. :..:..::.:::. : .:::. : : .:: :.: CCDS94 MPSWIGAVILP-LLGLLLSLPAG---ADVKARSCGEVRQAYGAKGFSLADIPYQEIAGEH 10 20 30 40 50 60 70 80 90 100 110 pF1KB3 LKICPQGSTCCSQEMEEKYSLQSKDDFKSVVSEQCNHLQAVFASRYKKFDEFFKELLENA :.:::: :::. :::.: : ::: .:...: : . ....:.::.:::::::.:::::: CCDS94 LRICPQEYTCCTTEMEDKLSQQSKLEFENLVEETSHFVRTTFVSRHKKFDEFFRELLENA 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB3 EKSLNDMFVKTYGHLYMQNSELFKDLFVELKRYYVVGNVNLEEMLNDFWARLLERMFRLV :::::::::.::: :::::::.:.:::.::::::. :::::::::::::::::::::.:. CCDS94 EKSLNDMFVRTYGMLYMQNSEVFQDLFTELKRYYTGGNVNLEEMLNDFWARLLERMFQLI 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB3 NSQYHFTDEYLECVSKYTEQLKPFGDVPRKLKLQVTRAFVAARTFAQGLAVAGDVVSKVS : ::::...:::::::::.:::::::::::::.::::::.:::::.:::.:. .:...:: CCDS94 NPQYHFSEDYLECVSKYTDQLKPFGDVPRKLKIQVTRAFIAARTFVQGLTVGREVANRVS 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB3 VVNPTAQCTHALLKMIYCSHCRGLVTVKPCYNYCSNIMRGCLANQGDLDFEWNNFIDAML :.:: : .::.::.:: .:::: ::.:: ::: :.:.::::::.::: ::: :::::: CCDS94 KVSPTPGCIRALMKMLYCPYCRGLPTVRPCNNYCLNVMKGCLANQADLDTEWNLFIDAML 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB3 MVAERLEGPFNIESVMDPIDVKISDAIMNMQDNSVQVSQKVFQGCGPPKPLPAGRISRSI .:::::::::::::::::::::::.::::::.::.::: ::::::: ::: :: : .:: CCDS94 LVAERLEGPFNIESVMDPIDVKISEAIMNMQENSMQVSAKVFQGCGQPKPAPALRSARSA 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB3 SESAFSARFRPHHPEERPTTAAGTSLDRLVTDVKEKLKQAKKFWSSLPSNVCNDERMAAG :. :..::::..:::::::::::::::::::.::::: .:: ::.:: ..:.:: ..:: CCDS94 PEN-FNTRFRPYNPEERPTTAAGTSLDRLVTDIKEKLKLSKKVWSALPYTICKDESVTAG 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB3 NGNEDDCWNGKGKSRYLFAVTGNGLANQGNNPEVQVDTSKPDILILRQIMALRVMTSKMK ..::..::::..:.::: . ..::.:: :::::.:: ..:: .: .:::::::::.:.: CCDS94 TSNEEECWNGHSKARYLPEIMNDGLTNQINNPEVDVDITRPDTFIRQQIMALRVMTNKLK 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB3 NAYNGNDVDFFDISDESSGEGSGSGCEYQQCPSEFDYNATDHAGKSANEK-ADSAGVRPG ::::::::.: : :::::: :::::: . ::.::.. .:. . . ... .::.... : CCDS94 NAYNGNDVNFQDTSDESSGSGSGSGCMDDVCPTEFEFVTTEAPAVDPDRREVDSSAAQRG 480 490 500 510 520 530 540 550 pF1KB3 AQAYLLTVFCILFLVMQREWR . .. ::. :..:: CCDS94 HSLLSWSLTCIV-LALQRLCR 540 550 >>CCDS5689.1 GPC2 gene_id:221914|Hs108|chr7 (579 aa) initn: 1250 init1: 474 opt: 1387 Z-score: 1596.9 bits: 305.4 E(32554): 1.3e-82 Smith-Waterman score: 1387; 42.6% identity (74.7% similar) in 479 aa overlap (27-499:29-505) 10 20 30 40 50 pF1KB3 MARFGLPALLCTLAVLSAALLAAELKSKSCSEVRRLYVSKGFNKNDAPLHEINGDHLK ..::.:.:.. ..:.. : : :.:.::. CCDS56 MSALRPLLLLLLPLCPGPGPGPGSEAKVTRSCAETRQVLGARGYSLNLIPPALISGEHLR 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB3 ICPQGSTCCSQEMEEKYSLQSKDDFKSVVSEQCNHLQAVFASRYKKFDEFFKELLENAEK .::: ::::.: :.. ... :...: .. . : ..:.:..:::::: :.: :.. CCDS56 VCPQEYTCCSSETEQRLIRETEATFRGLVEDSGSFLVHTLAARHRKFDEFFLEMLSVAQH 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB3 SLNDMFVKTYGHLYMQNSELFKDLFVELKRYYVVGNVNLEEMLNDFWARLLERMFRLVNS ::...: ..::.:: :.. .:. :: .:. .: .. .:.. : ::::.::::.: :.. CCDS56 SLTQLFSHSYGRLYAQHALIFNGLFSRLRDFYGESGEGLDDTLADFWAQLLERVFPLLHP 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB3 QYHFTDEYLECVSKYTEQ----LKPFGDVPRKLKLQVTRAFVAARTFAQGLAVAGDVVSK :: : .:: :.:. . . :.:::: ::.:.::.::..::::.:.::: .. .:::. CCDS56 QYSFPPDYLLCLSRLASSTDGSLQPFGDSPRRLRLQITRTLVAARAFVQGLETGRNVVSE 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB3 VSVVNPTAQCTHALLKMIYCSHCRGLVTVKPCYNYCSNIMRGCLANQGDLDFEWNNFIDA . : . :..::...: : :::. .. :: ..: :..::::...: :. .:.:..:. CCDS56 ALKVPVSEGCSQALMRLIGCPLCRGVPSLMPCQGFCLNVVRGCLSSRG-LEPDWGNYLDG 250 260 270 280 290 300 310 320 330 340 350 pF1KB3 MLMVAERLEGPFNIESVMDPIDVKISDAIMNMQDNSVQVSQKVFQGCGPPKPLPAGRISR .:..:..:.:::..: . . : ::::...: .:.::..:: .::: :::: :.:: : : CCDS56 LLILADKLQGPFSFELTAESIGVKISEGLMYLQENSAKVSAQVFQECGPPDPVPA-RNRR 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB3 SISESAFSARFRPH-HPEERPTTAAGTSLDRLVTDVKEKLKQAKKFWSSLPSNVCNDERM . ..:. ::::::::::.: ::: ...:.: . . ::. : .::.: :: CCDS56 APPPREEAGRLWSMVTEEERPTTAAGTNLHRLVWELRERLARMRGFWARLSLTVCGDSRM 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB3 AAGNGNED-DCWNGKGKSRYLFAVTGNGLANQGNNPEVQVDTSKPDILILRQIMALRVMT :: . : ::.: :..::: :.:.. :.: ::::..::.: ::. :. . ::. : CCDS56 AADASLEAAPCWTGAGRGRYLPPVVGGSPAEQVNNPELKVDASGPDVPTRRRRLQLRAAT 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB3 SKMKNAYNGNDVDFFDISDESSGEGSGSGCEYQQCPSEFDYNATDHAGKSANEKADSAGV ..::.: :.:.: : ....:: :.: CCDS56 ARMKTAALGHDLDGQDADEDASGSGGGQQYADDWMAGAVAPPARPPRPPYPPRRDGSGGK 480 490 500 510 520 530 >>CCDS2534.1 GPC1 gene_id:2817|Hs108|chr2 (558 aa) initn: 1516 init1: 1128 opt: 1158 Z-score: 1333.2 bits: 256.5 E(32554): 6.1e-68 Smith-Waterman score: 1640; 43.9% identity (75.0% similar) in 560 aa overlap (9-556:10-558) 10 20 30 40 50 pF1KB3 MARFGLPALLCTLAVLSA-ALLAAELKSKSCSEVRRLYVSKGFNKNDAPLHEINGDHLK :::. :.: : : ::.::.:::..: .:::. .:.: ::.:.::. CCDS25 MELRARGWWLLCAAAALVACARGDPASKSRSCGEVRQIYGAKGFSLSDVPQAEISGEHLR 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB3 ICPQGSTCCSQEMEEKYSLQSKDDFKSVVSEQCNHLQAVFASRYKKFDEFFKELLENAEK ::::: :::..::::. . .:. ...... .. :::..:.. ..::. :..::...:. CCDS25 ICPQGYTCCTSEMEENLANRSHAELETALRDSSRVLQAMLATQLRSFDDHFQHLLNDSER 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB3 SLNDMFVKTYGHLYMQNSELFKDLFVELKRYYVVGNVNLEEMLNDFWARLLERMFRLVNS .:. : ..:.:: ::.. :.::. ::. :: .:..::: : .::::::::.:. .. CCDS25 TLQATFPGAFGELYTQNARAFRDLYSELRLYYRGANLHLEETLAEFWARLLERLFKQLHP 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB3 QYHFTDEYLECVSKYTEQLKPFGDVPRKLKLQVTRAFVAARTFAQGLAVAGDVVSKVSVV : . :.::.:..: .: :.:::..::.:.:..::::::::.:.:::.::.::: ::. : CCDS25 QLLLPDDYLDCLGKQAEALRPFGEAPRELRLRATRAFVAARSFVQGLGVASDVVRKVAQV 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB3 NPTAQCTHALLKMIYCSHCRGLVTVKPCYNYCSNIMRGCLANQGDLDFEWNNFIDAMLMV .:..:..:..::.:: :. ..:: .:: :...::::::.::: :: :..:.:... CCDS25 PLGPECSRAVMKLVYCAHCLGVPGARPCPDYCRNVLKGCLANQADLDAEWRNLLDSMVLI 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB3 AERLEGPFNIESVMDPIDVKISDAIMNMQDNSVQVSQKVFQGCGPPKPLPAGRISRSISE .... : ..:::. . . ...:: .::: .. ::.:::: :: : : CCDS25 TDKFWGTSGVESVIGSVHTWLAEAINALQDNRDTLTAKVIQGCGNPKVNPQG-------P 310 320 330 340 350 360 370 380 390 400 410 pF1KB3 SAFSARFRPH-HPEERPTTAAGTSLDRLVTDVKEKLKQAKKFWSSLPSNVCNDERMAAGN . : : . :.::: . :: :..::...: .:.... :: :::...:. :.:: .. CCDS25 GPEEKRRRGKLAPRERPPS--GT-LEKLVSEAKAQLRDVQDFWISLPGTLCS-EKMALST 360 370 380 390 400 420 430 440 450 460 470 pF1KB3 GNEDDCWNGKGKSRYLFAVTGNGLANQGNNPEVQVDTSKPDILILRQIMALRVMTSKMKN ...: :::: ...::: : :.::::: :::::.:: .:::. : .::: :..::..... CCDS25 ASDDRCWNGMARGRYLPEVMGDGLANQINNPEVEVDITKPDMTIRQQIMQLKIMTNRLRS 410 420 430 440 450 460 480 490 500 510 520 pF1KB3 AYNGNDVDFFDISDESSGEGSGSGCEYQQCPSEFDYNATD------HA--GKSANE-KAD ::::::::: : ::..:: :::.:: . : . . .... :: : : .: . CCDS25 AYNGNDVDFQDASDDGSGSGSGDGCLDDLCSRKVSRKSSSSRTPLTHALPGLSEQEGQKT 470 480 490 500 510 520 530 540 550 pF1KB3 SAGVRPGAQAYLLTVFCILFLVMQR-EWR ::. : ..:: .. .: :.. : .:: CCDS25 SAASCPQPPTFLLPLLLFLALTVARPRWR 530 540 550 >>CCDS9468.1 GPC5 gene_id:2262|Hs108|chr13 (572 aa) initn: 706 init1: 426 opt: 712 Z-score: 818.9 bits: 161.4 E(32554): 2.7e-39 Smith-Waterman score: 750; 27.7% identity (62.8% similar) in 494 aa overlap (28-501:28-510) 10 20 30 40 50 pF1KB3 MARFGLPALLCTLAVLSAALLAAELKSKSCSEVRRLYVSKGFNK-NDAPLHEINGDHLKI ..: :::.:. . .. : : :.. CCDS94 MDAQTWPVGFRCLLLLALVGSARSEGVQTCEEVRKLFQWRLLGAVRGLPDSPRAGPDLQV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB3 C-PQGSTCCSQEMEEKYSLQSKDDFKSVVSEQCNHLQAVFASRYKKFDEFFKELLENAEK : . :::...:::.:.. ...:... .. . . :. ... :.: .. :...::. CCDS94 CISKKPTCCTRKMEERYQIAARQDMQQFLQTSSSTLKFLISRNAAAFQETLETLIKQAEN 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB3 SLNDMFVKTYGHLYMQNSELFKDLFVELKRYYVVGNVNLEEMLNDFWARLLERMF-RLVN . .: .:: .. .. . ...:... : ..:: ::..: :. :. .. .:.: CCDS94 YTSILFCSTYRNMALEAAASVQEFFTDVGLYLFGADVNPEEFVNRFFDSLFPLVYNHLIN 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB3 SQYHFTD---EYLECVSKYTEQLKPFGDVPRKLKLQVTRAFVAARTFAQGLAVAGDVVSK :: :: ::. ....:::..:... :. :... .::: :.: .. .:.. CCDS94 PG--VTDSSLEYSECIRMARRDVSPFGNIPQRVMGQMGRSLLPSRTFLQALNLGIEVINT 190 200 210 220 230 240 250 260 270 280 290 pF1KB3 VSVVNPTAQCTHALLKMIYCSHCRGLVTVKPCYNYCSNIMRGCLANQGDLDFEWNNFIDA .. .. . .:..::::: :: ::.::. .:::..:: :.::::::....:. .:. .: . CCDS94 TDYLHFSKECSRALLKMQYCPHCQGLALTKPCMGYCLNVMRGCLAHMAELNPHWHAYIRS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB3 MLMVAERLEGPFNIESVMDPIDVKISDAIMNMQDNSVQVSQKVFQGCGPPKPLPAGRISR . ... ..: ..: :. . . ..::... . :. .. ..: . :: : :. CCDS94 LEELSDAMHGTYDIGHVLLNFHLLVNDAVLQAHLNGQKLLEQVNRICGRPVRTPTQSPRC 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB3 SISESAFSARFRPHHPEERPTTAAGTSLDRLVTDVKEKLKQAKKFWSSLPSNVCNDERMA :...: . .: . : . .: . ..:. ..:...: ...: .: .: CCDS94 SFDQS------KEKHGMKTTTRNSEETLANRRKEFINSLRLYRSFYGGLADQLCANE-LA 360 370 380 390 400 410 420 430 440 450 460 pF1KB3 AGNGNEDDCWNGKGKSR-YLFAVTGNGLANQGNNPEVQVDTSKPDI--LI--LRQIMALR :..: ::::. . : :.:::. :..::::.: : : .: :.... : CCDS94 AADGLP--CWNGEDIVKSYTQRVVGNGIKAQSGNPEVKVKGIDPVINQIIDKLKHVVQLL 420 430 440 450 460 470 480 490 500 510 520 pF1KB3 VMTSKMKNAYN-------GNDVDFF--DISDESSGEGSGSGCEYQQCPSEFDYNATDHAG : . .. :. :. : .::.. ::::: CCDS94 QGRSPKPDKWELLQLGSGGGMVEQVSGDCDDEDGCGGSGSGEVKRTLKITDWMPDDMNFS 470 480 490 500 510 520 530 540 550 pF1KB3 KSANEKADSAGVRPGAQAYLLTVFCILFLVMQREWR CCDS94 DVKQIHQTDTGSTLDTTGAGCAVATESMTFTLISVVMLLPGIW 530 540 550 560 570 >>CCDS14638.1 GPC3 gene_id:2719|Hs108|chrX (580 aa) initn: 465 init1: 256 opt: 591 Z-score: 679.4 bits: 135.6 E(32554): 1.6e-31 Smith-Waterman score: 636; 26.9% identity (60.7% similar) in 494 aa overlap (29-501:34-512) 10 20 30 40 50 pF1KB3 MARFGLPALLCTLAVLSAALLAAELKSKSCSEVRRLYVSKGFNKNDAPLHEINGDHLK .: .:: .. . . .: . :. :. CCDS14 TVRTACLVVAMLLSLDFPGQAQPPPPPPDATCHQVRSFFQRLQPGLKWVPETPVPGSDLQ 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB3 IC-PQGSTCCSQEMEEKYSLQSKDDFKSVVSEQCNHLQAVFASRYKKFDEFFKELLENAE .: :.: ::::..:::::.: .. ....... .:. .. . :.: :. ....:. CCDS14 VCLPKGPTCCSRKMEEKYQLTARLNMEQLLQSASMELKFLIIQNAAVFQEAFEIVVRHAK 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB3 KSLNDMFVKTYGHLYMQNSELFKDLFVELKRYYVVGNVNLEEMLNDFWARLLERMF-RLV . : :: ..: : : :. ..:.... : . ...:...:.:... :. .. .:. CCDS14 NYTNAMFKNNYPSLTPQAFEFVGEFFTDVSLYILGSDINVDDMVNELFDSLFPVIYTQLM 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB3 NSQYHFTDEYL---ECVSKYTEQLKPFGDVPRKLKLQVTRAFVAARTFAQGLAVAGDVVS : . : : ::. ..:: ::. :. . ::.... ..: : :.: .. .:.. CCDS14 NP--GLPDSALDINECLRGARRDLKVFGNFPKLIMTQVSKSLQVTRIFLQALNLGIEVIN 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB3 KVSVVNPTAQCTHALLKMIYCSHCRGLVTVKPCYNYCSNIMRGCLANQGDLDFEWNNFID .. .. . .: . : .: :::.:.::. :::: .::. .:.::.:. ..: : ..: CCDS14 TTDHLKFSKDCGRMLTRMWYCSYCQGLMMVKPCGGYCNVVMQGCMAGVVEIDKYWREYIL 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB3 AMLMVAERLEGPFNIESVMDPIDVKISDAIMNMQDNSVQVSQKVFQGCGPPKPLPAGRIS .. ... . ...:.:. . : :.:. .: :. ... . . :. . : CCDS14 SLEELVNGMYRIYDMENVLLGLFSTIHDSIQYVQKNAGKLTTTIGKLCAHSQQ----RQY 310 320 330 340 350 360 370 380 390 400 pF1KB3 RSI--SESAFSAR--FRPHHPEERPTTAAGTSLDRLVTDVKEKLKQAKKFWSSLPSNVCN :: :. : . .. : :.. : .: : .. .:::. .:.:.::. .:. CCDS14 RSAYYPEDLFIDKKVLKVAHVEHEETL---SSRRR---ELIQKLKSFISFYSALPGYICS 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB3 DERMAAGNGNEDDCWNGKGK-SRYLFAVTGNGLANQGNNPEVQVDTSKPDI--LI--LRQ .: :. ::::. :: .. ::. :: : :... .: . .: :.. CCDS14 HSPVAE---NDTLCWNGQELVERYSQKAARNGMKNQFNLHELKMKGPEPVVSQIIDKLKH 420 430 440 450 460 470 480 490 500 510 pF1KB3 I-MALRVMTSKMKNAYNGN-DVDFFDISDESSGE-----GSGSGCEYQQCPSEFDYNATD : . ::.:. . . : : . :. .: .. : :::.: CCDS14 INQLLRTMSMPKGRVLDKNLDEEGFESGDCGDDEDECIGGSGDGMIKVKNQLRFLAELAY 470 480 490 500 510 520 520 530 540 550 pF1KB3 HAGKSANEKADSAGVRPGAQAYLLTVFCILFLVMQREWR CCDS14 DLDVDDAPGNSQQATPKDNEISTFHNLGNVHSPLKLLTSMAISVVCFFFLVH 530 540 550 560 570 580 >>CCDS55496.1 GPC3 gene_id:2719|Hs108|chrX (603 aa) initn: 447 init1: 309 opt: 523 Z-score: 600.7 bits: 121.1 E(32554): 3.9e-27 Smith-Waterman score: 620; 25.2% identity (60.2% similar) in 507 aa overlap (29-501:34-535) 10 20 30 40 50 pF1KB3 MARFGLPALLCTLAVLSAALLAAELKSKSCSEVRRLYVSKGFNKNDAPLHEINGDHLK .: .:: .. . . .: . :. :. CCDS55 TVRTACLVVAMLLSLDFPGQAQPPPPPPDATCHQVRSFFQRLQPGLKWVPETPVPGSDLQ 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB3 IC-PQGSTCCSQEMEEKYSLQSKDDFKSVVSEQCNHLQAVFASRYKKFDEFFKELLENAE .: :.: ::::..:::::.: .. ....... .:. .. . :.: :. ....:. CCDS55 VCLPKGPTCCSRKMEEKYQLTARLNMEQLLQSASMELKFLIIQNAAVFQEAFEIVVRHAK 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB3 KSLNDMFVKTYGHLYMQNSELFKDLFVELKRYYVVGNVNLEEMLNDFWARLLERMF-RLV . : :: ..: : : :. ..:.... : . ...:...:.:... :. .. .:. CCDS55 NYTNAMFKNNYPSLTPQAFEFVGEFFTDVSLYILGSDINVDDMVNELFDSLFPVIYTQLM 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB3 NSQYHFTDEYL---ECVSKYTEQLKPFGDVPRKLKLQVTRAFVAARTFAQGLAVAGDVVS : . : : ::. ..:: ::. :. . ::.... ..: : :.: .. .:.. CCDS55 NP--GLPDSALDINECLRGARRDLKVFGNFPKLIMTQVSKSLQVTRIFLQALNLGIEVIN 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB3 KVSVVNPTAQCTHALLKMIYCSHCRGLVTVKPCYNYCSNIMRGCLANQGDLDFEWNNFID .. .. . .: . : .: :::.:.::. :::: .::. .:.::.:. ..: : ..: CCDS55 TTDHLKFSKDCGRMLTRMWYCSYCQGLMMVKPCGGYCNVVMQGCMAGVVEIDKYWREYIL 250 260 270 280 290 300 300 310 320 330 340 pF1KB3 AMLMVAERLEGPFNIESVMDPIDVKISDAIMNMQDN-----SVQVSQKVFQGCGP----- .. ... . ...:.:. . : :.:. .: : .... .:... : CCDS55 SLEELVNGMYRIYDMENVLLGLFSTIHDSIQYVQKNAGKLTTTETEKKIWHFKYPIFFLC 310 320 330 340 350 360 350 360 370 380 390 pF1KB3 -PKPLPAGRISRSISESAFSARFRPHH--PEERPTTAAGTSLDRLVTDVK----EKLKQA : :.. .. . . . :. ... .: . .. ... . .:::. CCDS55 IGLDLQIGKLCAHSQQRQYRSAYYPEDLFIDKKVLKVAHVEHEETLSSRRRELIQKLKSF 370 380 390 400 410 420 400 410 420 430 440 450 pF1KB3 KKFWSSLPSNVCNDERMAAGNGNEDDCWNGKGK-SRYLFAVTGNGLANQGNNPEVQVDTS .:.:.::. .:. .: :. ::::. :: .. ::. :: : :... CCDS55 ISFYSALPGYICSHSPVAE---NDTLCWNGQELVERYSQKAARNGMKNQFNLHELKMKGP 430 440 450 460 470 460 470 480 490 500 pF1KB3 KPDI--LI--LRQI-MALRVMTSKMKNAYNGN-DVDFFDISDESSGE-----GSGSGCEY .: . .: :..: . ::.:. . . : : . :. .: .. : :::.: CCDS55 EPVVSQIIDKLKHINQLLRTMSMPKGRVLDKNLDEEGFESGDCGDDEDECIGGSGDGMIK 480 490 500 510 520 530 510 520 530 540 550 pF1KB3 QQCPSEFDYNATDHAGKSANEKADSAGVRPGAQAYLLTVFCILFLVMQREWR CCDS55 VKNQLRFLAELAYDLDVDDAPGNSQQATPKDNEISTFHNLGNVHSPLKLLTSMAISVVCF 540 550 560 570 580 590 >>CCDS55495.1 GPC3 gene_id:2719|Hs108|chrX (526 aa) initn: 382 init1: 256 opt: 456 Z-score: 524.4 bits: 106.8 E(32554): 6.9e-23 Smith-Waterman score: 501; 27.0% identity (60.0% similar) in 415 aa overlap (107-501:59-458) 80 90 100 110 120 130 pF1KB3 LQSKDDFKSVVSEQCNHLQAVFASRYKKFDEFFKELLENAEKSLNDMFVKTYGHLYMQNS : :. ....:.. : :: ..: : : CCDS55 PPPDATCHQVRSFFQRLQPGLKWVPETPVPEAFEIVVRHAKNYTNAMFKNNYPSLTPQAF 30 40 50 60 70 80 140 150 160 170 180 190 pF1KB3 ELFKDLFVELKRYYVVGNVNLEEMLNDFWARLLERMF-RLVNSQYHFTDEYL---ECVSK :. ..:.... : . ...:...:.:... :. .. .:.: . : : ::. CCDS55 EFVGEFFTDVSLYILGSDINVDDMVNELFDSLFPVIYTQLMNPG--LPDSALDINECLRG 90 100 110 120 130 140 200 210 220 230 240 250 pF1KB3 YTEQLKPFGDVPRKLKLQVTRAFVAARTFAQGLAVAGDVVSKVSVVNPTAQCTHALLKMI ..:: ::. :. . ::.... ..: : :.: .. .:.. .. .. . .: . : .: CCDS55 ARRDLKVFGNFPKLIMTQVSKSLQVTRIFLQALNLGIEVINTTDHLKFSKDCGRMLTRMW 150 160 170 180 190 200 260 270 280 290 300 310 pF1KB3 YCSHCRGLVTVKPCYNYCSNIMRGCLANQGDLDFEWNNFIDAMLMVAERLEGPFNIESVM :::.:.::. :::: .::. .:.::.:. ..: : ..: .. ... . ...:.:. CCDS55 YCSYCQGLMMVKPCGGYCNVVMQGCMAGVVEIDKYWREYILSLEELVNGMYRIYDMENVL 210 220 230 240 250 260 320 330 340 350 360 pF1KB3 DPIDVKISDAIMNMQDNSVQVSQKVFQGCGPPKPLPAGRISRSI--SESAFSAR--FRPH . : :.:. .: :. ... . . :. . : :: :. : . .. CCDS55 LGLFSTIHDSIQYVQKNAGKLTTTIGKLCAHSQQ----RQYRSAYYPEDLFIDKKVLKVA 270 280 290 300 310 320 370 380 390 400 410 420 pF1KB3 HPEERPTTAAGTSLDRLVTDVKEKLKQAKKFWSSLPSNVCNDERMAAGNGNEDDCWNGKG : :.. : .: : .. .:::. .:.:.::. .:. .: :. ::::. CCDS55 HVEHEETL---SSRRR---ELIQKLKSFISFYSALPGYICSHSPVAE---NDTLCWNGQE 330 340 350 360 370 430 440 450 460 470 480 pF1KB3 K-SRYLFAVTGNGLANQGNNPEVQVDTSKPDI--LI--LRQI-MALRVMTSKMKNAYNGN :: .. ::. :: : :... .: . .: :..: . ::.:. . . : CCDS55 LVERYSQKAARNGMKNQFNLHELKMKGPEPVVSQIIDKLKHINQLLRTMSMPKGRVLDKN 380 390 400 410 420 430 490 500 510 520 530 pF1KB3 -DVDFFDISDESSGE-----GSGSGCEYQQCPSEFDYNATDHAGKSANEKADSAGVRPGA : . :. .: .. : :::.: CCDS55 LDEEGFESGDCGDDEDECIGGSGDGMIKVKNQLRFLAELAYDLDVDDAPGNSQQATPKDN 440 450 460 470 480 490 556 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 04:52:20 2016 done: Sat Nov 5 04:52:20 2016 Total Scan time: 3.140 Total Display time: 0.110 Function used was FASTA [36.3.4 Apr, 2011]