FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6014, 698 aa 1>>>pF1KB6014 698 - 698 aa - 698 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.2475+/-0.000702; mu= 16.1618+/- 0.043 mean_var=88.8663+/-17.846, 0's: 0 Z-trim(112.3): 26 B-trim: 0 in 0/49 Lambda= 0.136052 statistics sampled from 13085 (13109) to 13085 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.744), E-opt: 0.2 (0.403), width: 16 Scan time: 4.390 The best scores are: opt bits E(32554) CCDS35178.1 QSOX2 gene_id:169714|Hs108|chr9 ( 698) 4775 947.1 0 CCDS1337.1 QSOX1 gene_id:5768|Hs108|chr1 ( 747) 1609 325.7 1.6e-88 CCDS30950.1 QSOX1 gene_id:5768|Hs108|chr1 ( 604) 1587 321.3 2.6e-87 >>CCDS35178.1 QSOX2 gene_id:169714|Hs108|chr9 (698 aa) initn: 4775 init1: 4775 opt: 4775 Z-score: 5061.8 bits: 947.1 E(32554): 0 Smith-Waterman score: 4775; 100.0% identity (100.0% similar) in 698 aa overlap (1-698:1-698) 10 20 30 40 50 60 pF1KB6 MAAAGAAVARSPGIGAGPALRARRSPPPRAARLPRLLVLLAAAAVGPGAGGAARLYRAGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 MAAAGAAVARSPGIGAGPALRARRSPPPRAARLPRLLVLLAAAAVGPGAGGAARLYRAGE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 DAVWVLDSGSVRGATANSSAAWLVQFYSSWCGHCIGYAPTWRALAGDVRDWASAIRVAAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 DAVWVLDSGSVRGATANSSAAWLVQFYSSWCGHCIGYAPTWRALAGDVRDWASAIRVAAL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 DCMEEKNQAVCHDYDIHFYPTFRYFKAFTKEFTTGENFKGPDRELRTVRQTMIDFLQNHT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 DCMEEKNQAVCHDYDIHFYPTFRYFKAFTKEFTTGENFKGPDRELRTVRQTMIDFLQNHT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 EGSRPPACPRLDPIQPSDVLSLLDNRGSHYVAIVFESNSSYLGREVILDLIPYESIVVTR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 EGSRPPACPRLDPIQPSDVLSLLDNRGSHYVAIVFESNSSYLGREVILDLIPYESIVVTR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB6 ALDGDKAFLEKLGVSSVPSCYLIYPNGSHGLINVVKPLRAFFSSYLKSLPDVRKKSLPLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 ALDGDKAFLEKLGVSSVPSCYLIYPNGSHGLINVVKPLRAFFSSYLKSLPDVRKKSLPLP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB6 EKPHKEENSEIVVWREFDKSKLYTVDLESGLHYLLRVELAAHKSLAGAELKTLKDFVTVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 EKPHKEENSEIVVWREFDKSKLYTVDLESGLHYLLRVELAAHKSLAGAELKTLKDFVTVL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB6 AKLFPGRPPVKKLLEMLQEWLASLPLDRIPYNAVLDLVNNKMRISGIFLTNHIKWVGCQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 AKLFPGRPPVKKLLEMLQEWLASLPLDRIPYNAVLDLVNNKMRISGIFLTNHIKWVGCQG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB6 SRSELRGYPCSLWKLFHTLTVEASTHPDALVGTGFEDDPQAVLQTMRRYVHTFFGCKECG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 SRSELRGYPCSLWKLFHTLTVEASTHPDALVGTGFEDDPQAVLQTMRRYVHTFFGCKECG 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB6 EHFEEMAKESMDSVKTPDQAILWLWKKHNMVNGRLAGHLSEDPRFPKLQWPTPDLCPACH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 EHFEEMAKESMDSVKTPDQAILWLWKKHNMVNGRLAGHLSEDPRFPKLQWPTPDLCPACH 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB6 EEIKGLASWDEGHVLTFLKQHYGRDNLLDTYSADQGDSSEGGTLARGEEEEKRLTPPEVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 EEIKGLASWDEGHVLTFLKQHYGRDNLLDTYSADQGDSSEGGTLARGEEEEKRLTPPEVS 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB6 HGDRDTQSVRPPGALGPRPALPESLHHSLDGKLQSLDGPGAHKEVGGAAPFLGVDFSSLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 HGDRDTQSVRPPGALGPRPALPESLHHSLDGKLQSLDGPGAHKEVGGAAPFLGVDFSSLD 610 620 630 640 650 660 670 680 690 pF1KB6 MSLCVVLYVASSLFLMVMYFFFRVRSRRWKVKHHHPAV :::::::::::::::::::::::::::::::::::::: CCDS35 MSLCVVLYVASSLFLMVMYFFFRVRSRRWKVKHHHPAV 670 680 690 >>CCDS1337.1 QSOX1 gene_id:5768|Hs108|chr1 (747 aa) initn: 1645 init1: 554 opt: 1609 Z-score: 1702.9 bits: 325.7 E(32554): 1.6e-88 Smith-Waterman score: 1617; 41.5% identity (67.6% similar) in 620 aa overlap (25-629:8-613) 10 20 30 40 50 pF1KB6 MAAAGAAVARSPGIGAGPALRARRSPPPRAARLPRLLVLLAAAAVGPGAGGAAR--LYRA : :: : ::.:: . :::..: : :: . CCDS13 MRRCNSGSGPP-----PSLLLLLLWLLAVPGANAAPRSALY-S 10 20 30 60 70 80 90 100 110 pF1KB6 GEDAVWVLDSGSVRGATANSSAAWLVQFYSSWCGHCIGYAPTWRALAGDVRDWASAIRVA : . .:.. .::::. .: .:: :.:..:::::::..::::.::: ::. : :. .: CCDS13 PSDPLTLLQADTVRGAVLGSRSAWAVEFFASWCGHCIAFAPTWKALAEDVKAWRPALYLA 40 50 60 70 80 90 120 130 140 150 160 170 pF1KB6 ALDCMEEKNQAVCHDYDIHFYPTFRYFKAFTKEFTTGENFKGPDRELRTVRQTMIDFLQN :::: :: :.:::.:..: .:: :.::::::. .: : ...:.:. .:: :.. CCDS13 ALDCAEETNSAVCRDFNIPGFPTVRFFKAFTKN-GSGAVFPVAGADVQTLRERLIDALES 100 110 120 130 140 150 180 190 200 210 220 230 pF1KB6 HTEGSRPPACPRLDPIQPSDVLSLLDNRGSHYVAIVFESNSSYLGREVILDLIPYESIVV : . . ::::: :.: . .. ... . .:.:..::...::::::: ::: .....: CCDS13 HHD-TWPPACPPLEPAKLEEIDGFFARNNEEYLALIFEKGGSYLGREVALDLSQHKGVAV 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB6 TRALDGDKAFLEKLGVSSVPSCYLIYPNGSHGLINVVKPLRAFFSSYLKSLPDVRKKSLP :.:. . ..:.::.. :::::.. ::: . . :. :.:...::. : . ... CCDS13 RRVLNTEANVVRKFGVTDFPSCYLLFRNGSVSRVPVLMESRSFYTAYLQRLSGLTREAAQ 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB6 LPEKPHKEENSEIVVWREFDKSKLYTVDLESGLHYLLRVELAAHKSLAGAELKTLKDFVT : .. .::. :.::.: .::::.:::.::.:.. : : .: .:: ::. CCDS13 TTVAPTTANKIAPTVWKLADRSKIYMADLESALHYILRIEVGRFPVLEGQRLVALKKFVA 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB6 VLAKLFPGRPPVKKLLEMLQEWLASLPLDRIPYNAVLDLVNNKMRISGIFLTNHIKWVGC :::: ::::: :...:. ..::: ..:::. ... : : :.....:.:: CCDS13 VLAKYFPGRPLVQNFLHSVNEWLKRQKRNKIPYSFFKTALDD--RKEGAVLAKKVNWIGC 340 350 360 370 380 390 420 430 440 450 460 470 pF1KB6 QGSRSELRGYPCSLWKLFHTLTVEASTHPDALVGTGFEDDPQAVLQTMRRYVHTFFGCKE :::. ..::.::::: ::: :::.:. . . . . :: ..: ::: ::::.. CCDS13 QGSEPHFRGFPCSLWVLFHFLTVQAARQ--NVDHSQEAAKAKEVLPAIRGYVHYFFGCRD 400 410 420 430 440 450 480 490 500 510 520 530 pF1KB6 CGEHFEEMAKESMDSVKTPDQAILWLWKKHNMVNGRLAGHLSEDPRFPKLQWPTPDLCPA :. :::.:: :: : .:. :.::::..:: ::.:::: ::::.:::.::: .:: : CCDS13 CASHFEQMAAASMHRVGSPNAAVLWLWSSHNRVNARLAGAPSEDPQFPKVQWPPRELCSA 460 470 480 490 500 510 540 550 560 570 580 590 pF1KB6 CHEEIKGLASWDEGHVLTFLKQHYGRDNLLDTYSA-------DQGDSSEGGTLARGEEE- ::.: . :: .:.::: :.. .:.. . : : . . . :: : : CCDS13 CHNERLDVPVWDVEATLNFLKAHFSPSNIILDFPAAGSAARRDVQNVAAAPELAMGALEL 520 530 540 550 560 570 600 610 620 630 640 pF1KB6 EKR---LTP--PEVSHGDRDTQSVRPPGALGPRPALPESLHHSLDGKLQSLDGPGAHKEV :.: : : ::. .. .: : : ::. . : .:: .: CCDS13 ESRNSTLDPGKPEMMKSPTNTTPHVP--AEGPEASRPPKLHPGLRAAPGQEPPEHMAELQ 580 590 600 610 620 650 660 670 680 690 pF1KB6 GGAAPFLGVDFSSLDMSLCVVLYVASSLFLMVMYFFFRVRSRRWKVKHHHPAV CCDS13 RNEQEQPLGQWHLSKRDTGAALLAESRAEKNRLWGPLEVRRVGRSSKQLVDIPEGQLEAR 630 640 650 660 670 680 >>CCDS30950.1 QSOX1 gene_id:5768|Hs108|chr1 (604 aa) initn: 1531 init1: 554 opt: 1587 Z-score: 1681.0 bits: 321.3 E(32554): 2.6e-87 Smith-Waterman score: 1596; 41.1% identity (68.7% similar) in 603 aa overlap (25-624:8-588) 10 20 30 40 50 pF1KB6 MAAAGAAVARSPGIGAGPALRARRSPPPRAARLPRLLVLLAAAAVGPGAGGAAR--LYRA : :: : ::.:: . :::..: : :: . CCDS30 MRRCNSGSGPP-----PSLLLLLLWLLAVPGANAAPRSALY-S 10 20 30 60 70 80 90 100 110 pF1KB6 GEDAVWVLDSGSVRGATANSSAAWLVQFYSSWCGHCIGYAPTWRALAGDVRDWASAIRVA : . .:.. .::::. .: .:: :.:..:::::::..::::.::: ::. : :. .: CCDS30 PSDPLTLLQADTVRGAVLGSRSAWAVEFFASWCGHCIAFAPTWKALAEDVKAWRPALYLA 40 50 60 70 80 90 120 130 140 150 160 170 pF1KB6 ALDCMEEKNQAVCHDYDIHFYPTFRYFKAFTKEFTTGENFKGPDRELRTVRQTMIDFLQN :::: :: :.:::.:..: .:: :.::::::. .: : ...:.:. .:: :.. CCDS30 ALDCAEETNSAVCRDFNIPGFPTVRFFKAFTKN-GSGAVFPVAGADVQTLRERLIDALES 100 110 120 130 140 150 180 190 200 210 220 230 pF1KB6 HTEGSRPPACPRLDPIQPSDVLSLLDNRGSHYVAIVFESNSSYLGREVILDLIPYESIVV : . . ::::: :.: . .. ... . .:.:..::...::::::: ::: .....: CCDS30 HHD-TWPPACPPLEPAKLEEIDGFFARNNEEYLALIFEKGGSYLGREVALDLSQHKGVAV 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB6 TRALDGDKAFLEKLGVSSVPSCYLIYPNGSHGLINVVKPLRAFFSSYLKSLPDVRKKSLP :.:. . ..:.::.. :::::.. ::: . . :. :.:...::. : . ... CCDS30 RRVLNTEANVVRKFGVTDFPSCYLLFRNGSVSRVPVLMESRSFYTAYLQRLSGLTREAAQ 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB6 LPEKPHKEENSEIVVWREFDKSKLYTVDLESGLHYLLRVELAAHKSLAGAELKTLKDFVT : .. .::. :.::.: .::::.:::.::.:.. : : .: .:: ::. CCDS30 TTVAPTTANKIAPTVWKLADRSKIYMADLESALHYILRIEVGRFPVLEGQRLVALKKFVA 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB6 VLAKLFPGRPPVKKLLEMLQEWLASLPLDRIPYNAVLDLVNNKMRISGIFLTNHIKWVGC :::: ::::: :...:. ..::: ..:::. ... : : :.....:.:: CCDS30 VLAKYFPGRPLVQNFLHSVNEWLKRQKRNKIPYSFFKTALDD--RKEGAVLAKKVNWIGC 340 350 360 370 380 390 420 430 440 450 460 470 pF1KB6 QGSRSELRGYPCSLWKLFHTLTVEASTHPDALVGTGFEDDPQAVLQTMRRYVHTFFGCKE :::. ..::.::::: ::: :::.:. . . . . :: ..: ::: ::::.. CCDS30 QGSEPHFRGFPCSLWVLFHFLTVQAARQ--NVDHSQEAAKAKEVLPAIRGYVHYFFGCRD 400 410 420 430 440 450 480 490 500 510 520 530 pF1KB6 CGEHFEEMAKESMDSVKTPDQAILWLWKKHNMVNGRLAGHLSEDPRFPKLQWPTPDLCPA :. :::.:: :: : .:. :.::::..:: ::.:::: ::::.:::.::: .:: : CCDS30 CASHFEQMAAASMHRVGSPNAAVLWLWSSHNRVNARLAGAPSEDPQFPKVQWPPRELCSA 460 470 480 490 500 510 540 550 560 570 580 590 pF1KB6 CHEEIKGLASWDEGHVLTFLKQHYGRDNLLDTYSADQGDSSEGGTLARGEEEEKRLTPPE ::.: . :: .:.::: :.. .:.. . : .:. :: .. .. . :: CCDS30 CHNERLDVPVWDVEATLNFLKAHFSPSNIILDFPA-------AGSAAR-RDVQNVAAAPE 520 530 540 550 560 600 610 620 630 640 650 pF1KB6 VSHGDRDTQSVRPPGALGP-RPALPESLHHSLDGKLQSLDGPGAHKEVGGAAPFLGVDFS .. : . .: ..: : .: . .: CCDS30 LAMGALELESRN--STLDPGKPEMMKSPTNTTPHVPAEGPELI 570 580 590 600 698 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 07:22:08 2016 done: Sat Nov 5 07:22:09 2016 Total Scan time: 4.390 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]