FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB3017, 798 aa
1>>>pF1KB3017 798 - 798 aa - 798 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.5143+/-0.00121; mu= 10.7805+/- 0.073
mean_var=200.4305+/-38.350, 0's: 0 Z-trim(109.7): 121 B-trim: 48 in 2/48
Lambda= 0.090593
statistics sampled from 10937 (11060) to 10937 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.688), E-opt: 0.2 (0.34), width: 16
Scan time: 4.020
The best scores are: opt bits E(32554)
CCDS8849.1 ITGB7 gene_id:3695|Hs108|chr12 ( 798) 5618 748.0 1.4e-215
CCDS13716.1 ITGB2 gene_id:3689|Hs108|chr21 ( 769) 2524 343.6 7.5e-94
CCDS7174.1 ITGB1 gene_id:3688|Hs108|chr10 ( 798) 2226 304.6 4.1e-82
CCDS11511.1 ITGB3 gene_id:3690|Hs108|chr17 ( 788) 2065 283.6 8.8e-76
CCDS2212.1 ITGB6 gene_id:3694|Hs108|chr2 ( 788) 2054 282.1 2.4e-75
CCDS3030.1 ITGB5 gene_id:3693|Hs108|chr3 ( 799) 2043 280.7 6.5e-75
CCDS74596.1 ITGB6 gene_id:3694|Hs108|chr2 ( 746) 1946 268.0 4.1e-71
CCDS74597.1 ITGB6 gene_id:3694|Hs108|chr2 ( 693) 1786 247.1 7.6e-65
CCDS63040.1 ITGB6 gene_id:3694|Hs108|chr2 ( 681) 1568 218.6 2.8e-56
CCDS58599.1 ITGB4 gene_id:3691|Hs108|chr17 (1752) 1376 193.9 1.9e-48
CCDS32736.1 ITGB4 gene_id:3691|Hs108|chr17 (1805) 1376 193.9 2e-48
CCDS11727.1 ITGB4 gene_id:3691|Hs108|chr17 (1822) 1376 193.9 2e-48
CCDS5370.1 ITGB8 gene_id:3696|Hs108|chr7 ( 769) 1339 188.7 3.2e-47
>>CCDS8849.1 ITGB7 gene_id:3695|Hs108|chr12 (798 aa)
initn: 5618 init1: 5618 opt: 5618 Z-score: 3983.6 bits: 748.0 E(32554): 1.4e-215
Smith-Waterman score: 5618; 100.0% identity (100.0% similar) in 798 aa overlap (1-798:1-798)
10 20 30 40 50 60
pF1KB3 MVALPMVLVLLLVLSRGESELDAKIPSTGDATEWRNPHLSMLGSCQPAPSCQKCILSHPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 MVALPMVLVLLLVLSRGESELDAKIPSTGDATEWRNPHLSMLGSCQPAPSCQKCILSHPS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 CAWCKQLNFTASGEAEARRCARREELLARGCPLEELEEPRGQQEVLQDQPLSQGARGEGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 CAWCKQLNFTASGEAEARRCARREELLARGCPLEELEEPRGQQEVLQDQPLSQGARGEGA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 TQLAPQRVRVTLRPGEPQQLQVRFLRAEGYPVDLYYLMDLSYSMKDDLERVRQLGHALLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 TQLAPQRVRVTLRPGEPQQLQVRFLRAEGYPVDLYYLMDLSYSMKDDLERVRQLGHALLV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB3 RLQEVTHSVRIGFGSFVDKTVLPFVSTVPSKLRHPCPTRLERCQSPFSFHHVLSLTGDAQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 RLQEVTHSVRIGFGSFVDKTVLPFVSTVPSKLRHPCPTRLERCQSPFSFHHVLSLTGDAQ
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB3 AFEREVGRQSVSGNLDSPEGGFDAILQAALCQEQIGWRNVSRLLVFTSDDTFHTAGDGKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 AFEREVGRQSVSGNLDSPEGGFDAILQAALCQEQIGWRNVSRLLVFTSDDTFHTAGDGKL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB3 GGIFMPSDGHCHLDSNGLYSRSTEFDYPSVGQVAQALSAANIQPIFAVTSAALPVYQELS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 GGIFMPSDGHCHLDSNGLYSRSTEFDYPSVGQVAQALSAANIQPIFAVTSAALPVYQELS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB3 KLIPKSAVGELSEDSSNVVQLIMDAYNSLSSTVTLEHSSLPPGVHISYESQCEGPEKREG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 KLIPKSAVGELSEDSSNVVQLIMDAYNSLSSTVTLEHSSLPPGVHISYESQCEGPEKREG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB3 KAEDRGQCNHVRINQTVTFWVSLQATHCLPEPHLLRLRALGFSEELIVELHTLCDCNCSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 KAEDRGQCNHVRINQTVTFWVSLQATHCLPEPHLLRLRALGFSEELIVELHTLCDCNCSD
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB3 TQPQAPHCSDGQGHLQCGVCSCAPGRLGRLCECSVAELSSPDLESGCRAPNGTGPLCSGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 TQPQAPHCSDGQGHLQCGVCSCAPGRLGRLCECSVAELSSPDLESGCRAPNGTGPLCSGK
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB3 GHCQCGRCSCSGQSSGHLCECDDASCERHEGILCGGFGRCQCGVCHCHANRTGRACECSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 GHCQCGRCSCSGQSSGHLCECDDASCERHEGILCGGFGRCQCGVCHCHANRTGRACECSG
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB3 DMDSCISPEGGLCSGHGRCKCNRCQCLDGYYGALCDQCPGCKTPCERHRDCAECGAFRTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 DMDSCISPEGGLCSGHGRCKCNRCQCLDGYYGALCDQCPGCKTPCERHRDCAECGAFRTG
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB3 PLATNCSTACAHTNVTLALAPILDDGWCKERTLDNQLFFFLVEDDARGTVVLRVRPQEKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 PLATNCSTACAHTNVTLALAPILDDGWCKERTLDNQLFFFLVEDDARGTVVLRVRPQEKG
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB3 ADHTQAIVLGCVGGIVAVGLGLVLAYRLSVEIYDRREYSRFEKEQQQLNWKQDSNPLYKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 ADHTQAIVLGCVGGIVAVGLGLVLAYRLSVEIYDRREYSRFEKEQQQLNWKQDSNPLYKS
730 740 750 760 770 780
790
pF1KB3 AITTTINPRFQEADSPTL
::::::::::::::::::
CCDS88 AITTTINPRFQEADSPTL
790
>>CCDS13716.1 ITGB2 gene_id:3689|Hs108|chr21 (769 aa)
initn: 1666 init1: 896 opt: 2524 Z-score: 1798.4 bits: 343.6 E(32554): 7.5e-94
Smith-Waterman score: 2524; 48.3% identity (73.9% similar) in 756 aa overlap (50-793:32-769)
20 30 40 50 60 70
pF1KB3 ELDAKIPSTGDATEWRNPHLSMLGSCQPAPSCQKCILSHPSCAWCKQLNFTASGEAEARR
::..:: : :.:.::..::::. :. .. :
CCDS13 LGLRPPLLALVGLLSLGCVLSQECTKFKVSSCRECIESGPGCTWCQKLNFTGPGDPDSIR
10 20 30 40 50 60
80 90 100 110 120 130
pF1KB3 CARREELLARGCPLEELEEPRGQQEVLQDQPLSQGARGEGATQLAPQRVRVTLRPGEPQQ
: : .:: ::: ... .: . :. .:. .: : ::.::.: . ::::.
CCDS13 CDTRPQLLMRGCAADDIMDPTSLAETQEDH---NG----GQKQLSPQKVTLYLRPGQAAA
70 80 90 100 110
140 150 160 170 180 190
pF1KB3 LQVRFLRAEGYPVDLYYLMDLSYSMKDDLERVRQLGHALLVRLQEVTHSVRIGFGSFVDK
..: : ::.:::.:::::::::::: :::. :..:: :: :.:.:.: ::::::::::
CCDS13 FNVTFRRAKGYPIDLYYLMDLSYSMLDDLRNVKKLGGDLLRALNEITESGRIGFGSFVDK
120 130 140 150 160 170
200 210 220 230 240 250
pF1KB3 TVLPFVSTVPSKLRHPCPTRLERCQSPFSFHHVLSLTGDAQAFEREVGRQSVSGNLDSPE
::::::.: :.:::.:::.. ..:: ::.:.:::.::.... :. :::.: .:::::.::
CCDS13 TVLPFVNTHPDKLRNPCPNKEKECQPPFAFRHVLKLTNNSNQFQTEVGKQLISGNLDAPE
180 190 200 210 220 230
260 270 280 290 300 310
pF1KB3 GGFDAILQAALCQEQIGWRNVSRLLVFTSDDTFHTAGDGKLGGIFMPSDGHCHLDSNGLY
::.::..:.: : :.::::::.:::::..:: :: :::::::.:. :.::.:::..: ::
CCDS13 GGLDAMMQVAACPEEIGWRNVTRLLVFATDDGFHFAGDGKLGAILTPNDGRCHLEDN-LY
240 250 260 270 280 290
320 330 340 350 360 370
pF1KB3 SRSTEFDYPSVGQVAQALSAANIQPIFAVTSAALPVYQELSKLIPKSAVGELSEDSSNVV
.::.:::::::::.:. :. :::::::::: . .:..:...:::::::::::::::::
CCDS13 KRSNEFDYPSVGQLAHKLAENNIQPIFAVTSRMVKTYEKLTEIIPKSAVGELSEDSSNVV
300 310 320 330 340 350
380 390 400 410 420 430
pF1KB3 QLIMDAYNSLSSTVTLEHSSLPPGVHISYESQC-EGPEKREGKAEDRGQCNHVRINQTVT
.:: .:::.::: : :.:..:: ....:.: : .: .:. . ::.:. :.:: .:
CCDS13 HLIKNAYNKLSSRVFLDHNALPDTLKVTYDSFCSNGVTHRN---QPRGDCDGVQINVPIT
360 370 380 390 400 410
440 450 460 470 480 490
pF1KB3 FWVSLQATHCLPEPHLLRLRALGFSEELIVELHTLCDCNCSDTQPQAPHCSDGQGHLQCG
: :.. ::.:. : .. .:::::.. . :.. :.: : : . . : :.: :.::
CCDS13 FQVKVTATECIQEQSFV-IRALGFTDIVTVQVLPQCECRCRDQSRDRSLCH-GKGFLECG
420 430 440 450 460
500 510 520 530 540 550
pF1KB3 VCSCAPGRLGRLCECSVAELSSPDLESGCRAPNGTGPLCSGKGHCQCGRCSCSGQSS---
.: : : .:. :::.. :: .::..:: :.. .::: : : ::.: : ..
CCDS13 ICRCDTGYIGKNCECQTQGRSSQELEGSCRKDNNS-IICSGLGDCVCGQCLCHTSDVPGK
470 480 490 500 510 520
560 570 580 590 600 610
pF1KB3 ---GHLCECDDASCERHEGILCGGFGR--CQCGVCHCHANRTGRACECSGDMDSCISPEG
:. :::: .:::..: .::: :: : :: :.:: . : ::.: ..:..:.
CCDS13 LIYGQYCECDTINCERYNGQVCGGPGRGLCFCGKCRCHPGFEGSACQCERTTEGCLNPRR
530 540 550 560 570 580
620 630 640 650 660 670
pF1KB3 GLCSGHGRCKCNRCQCLDGYYGALCDQCPGCKTPCERHRDCAECGAFRTGPLATNCSTAC
:::.:::.:: :.: .:: ::..:::: .:: .. .:::: :. ::.. :::.::
CCDS13 VECSGRGRCRCNVCECHSGYQLPLCQECPGCPSPCGKYISCAECLKFEKGPFGKNCSAAC
590 600 610 620 630 640
680 690 700 710 720
pF1KB3 AHTNVTLALAPILDDGWCKERTLDN-QLFFFLVEDDARGTVVLRVRPQEK--GADHTQAI
.. :. :. :::: .. . . : ..:. .. : ... .. . ::
CCDS13 P--GLQLSNNPV-KGRTCKERDSEGCWVAYTLEQQDGMDRYLIYVDESRECVAGPNIAAI
650 660 670 680 690 700
730 740 750 760 770 780
pF1KB3 VLGCVGGIVAVGLGLVLAYRLSVEIYDRREYSRFEKEQQQLNWKQDSNPLYKSAITTTIN
: : :.::: .:. :.. .. ... : ::: :::::. . .:..: :::.::: ::..:
CCDS13 VGGTVAGIVLIGILLLVIWKALIHLSDLREYRRFEKEKLKSQWNND-NPLFKSATTTVMN
710 720 730 740 750 760
790
pF1KB3 PRFQEADSPTL
:.: :.
CCDS13 PKFAES
>>CCDS7174.1 ITGB1 gene_id:3688|Hs108|chr10 (798 aa)
initn: 1601 init1: 506 opt: 2226 Z-score: 1587.7 bits: 304.6 E(32554): 4.1e-82
Smith-Waterman score: 2477; 45.1% identity (72.8% similar) in 771 aa overlap (48-791:32-796)
20 30 40 50 60 70
pF1KB3 ESELDAKIPSTGDATEWRNPHLSMLGSCQPAPSCQKCILSHPSCAWCKQLNFTASGEAEA
: :: .:: . :.:.:: . .: : .
CCDS71 NLQPIFWIGLISSVCCVFAQTDENRCLKANAKSCGECIQAGPNCGWCTNSTFLQEGMPTS
10 20 30 40 50 60
80 90 100 110 120 130
pF1KB3 RRCARREELLARGCPLEELEEPRGQQEVLQDQPLSQGARG-------EGATQLAPQRVRV
:: : : .::: ...:.:::.... ... ... ..: : ::. ::.. .
CCDS71 ARCDDLEALKKKGCPPDDIENPRGSKDIKKNKNVTNRSKGTAEKLKPEDITQIQPQQLVL
70 80 90 100 110 120
140 150 160 170 180 190
pF1KB3 TLRPGEPQQLQVRFLRAEGYPVDLYYLMDLSYSMKDDLERVRQLGHALLVRLQEVTHSVR
:: :::: . ..: ::: ::.::::::::::::::::: :..:: :. .....: . :
CCDS71 RLRSGEPQTFTLKFKRAEDYPIDLYYLMDLSYSMKDDLENVKSLGTDLMNEMRRITSDFR
130 140 150 160 170 180
200 210 220 230 240 250
pF1KB3 IGFGSFVDKTVLPFVSTVPSKLRHPCPTRLERCQSPFSFHHVLSLTGDAQAFEREVGRQS
:::::::.:::.:..::.:.:::.:: : . : ::::...:::::. ...:.. ::.:
CCDS71 IGFGSFVEKTVMPYISTTPAKLRNPC-TSEQNCTSPFSYKNVLSLTNKGEVFNELVGKQR
190 200 210 220 230 240
260 270 280 290 300 310
pF1KB3 VSGNLDSPEGGFDAILQAALCQEQIGWRNVSRLLVFTSDDTFHTAGDGKLGGIFMPSDGH
.::::::::::::::.:.:.: ::::::.:::::..: :: ::::::::: .:.::.
CCDS71 ISGNLDSPEGGFDAIMQVAVCGSLIGWRNVTRLLVFSTDAGFHFAGDGKLGGIVLPNDGQ
250 260 270 280 290 300
320 330 340 350 360 370
pF1KB3 CHLDSNGLYSRSTEFDYPSVGQVAQALSAANIQPIFAVTSAALPVYQELSKLIPKSAVGE
:::..: .:. : .::::.....: :: ::: ::::: :::.::..::::::::
CCDS71 CHLENN-MYTMSHYYDYPSIAHLVQKLSENNIQTIFAVTEEFQPVYKELKNLIPKSAVGT
310 320 330 340 350
380 390 400 410 420 430
pF1KB3 LSEDSSNVVQLIMDAYNSLSSTVTLEHSSLPPGVHISYESQCEGPEKREGKAEDRGQCNH
:: .::::.:::.:::::::: : ::...: :: :::.: :.. . : .:. .:..
CCDS71 LSANSSNVIQLIIDAYNSLSSEVILENGKLSEGVTISYKSYCKNGVN--GTGENGRKCSN
360 370 380 390 400 410
440 450 460 470 480
pF1KB3 VRINQTVTFWVSLQATHCLP--EPHLLRLRALGFSEELIVELHTLCDCNC-SDTQPQAPH
. :.. : : .:. ...: : . ...: :::.::. : :. .:.:.: :. :..:.
CCDS71 ISIGDEVQFEISITSNKC-PKKDSDSFKIRPLGFTEEVEVILQYICECECQSEGIPESPK
420 430 440 450 460 470
490 500 510 520 530 540
pF1KB3 CSDGQGHLQCGVCSCAPGRLGRLCECSVAELSSPDLESGCRAPNGTGPLCSGKGHCQCGR
: .:.: ..::.: : ::.:: ::::. :..: :... :: : .. .::..:.: ::.
CCDS71 CHEGNGTFECGACRCNEGRVGRHCECSTDEVNSEDMDAYCRKEN-SSEICSNNGECVCGQ
480 490 500 510 520 530
550 560 570 580 590 600
pF1KB3 CSCSGQS------SGHLCECDDASCERHEGILCGGFGRCQCGVCHCHANRTGRACECSGD
: : .. ::..::::. .:.: .:..::: : :.: ::.:. : :: ::.:: :
CCDS71 CVCRKRDNTNEIYSGKFCECDNFNCDRSNGLICGGNGVCKCRVCECNPNYTGSACDCSLD
540 550 560 570 580 590
610 620 630 640 650 660
pF1KB3 MDSCISPEGGLCSGHGRCKCNRCQCLDG-YYGALCDQCPGCKTPCERHRDCAECGAFRTG
..: . .: .:.:.: :.:. :.: : . : :..: : : .:..:..: :: :
CCDS71 TSTCEASNGQICNGRGICECGVCKCTDPKFQGQTCEMCQTCLGVCAEHKECVQCRAFNKG
600 610 620 630 640 650
670 680 690 700 710
pF1KB3 PLATNCSTACAHTNVTLALA------PILDD--GWCKERTLDNQLFFFLVEDDARGTVVL
.:. :.. :.: . . :. : . :::. .:. :.: .. . :..
CCDS71 EKKDTCTQECSYFNITKVESRDKLPQPVQPDPVSHCKEKDVDDCWFYFTYSVNGNNEVMV
660 670 680 690 700 710
720 730 740 750 760 770
pF1KB3 RV--RPQEKGADHTQAIVLGCVGGIVAVGLGLVLAYRLSVEIYDRREYSRFEKEQQQLNW
.: :. . :: : :.::: .::.:.: ..: . :.::::...::::... .:
CCDS71 HVVENPECPTGPDIIPIVAGVVAGIVLIGLALLLIWKLLMIIHDRREFAKFEKEKMNAKW
720 730 740 750 760 770
780 790
pF1KB3 KQDSNPLYKSAITTTINPRFQEADSPTL
::.::::.::..::...
CCDS71 DTGENPIYKSAVTTVVNPKYEGK
780 790
>>CCDS11511.1 ITGB3 gene_id:3690|Hs108|chr17 (788 aa)
initn: 1114 init1: 607 opt: 2065 Z-score: 1474.0 bits: 283.6 E(32554): 8.8e-76
Smith-Waterman score: 2065; 40.3% identity (68.1% similar) in 762 aa overlap (50-791:38-786)
20 30 40 50 60 70
pF1KB3 ELDAKIPSTGDATEWRNPHLSMLGSCQPAPSCQKCILSHPSCAWCKQLNFTASGEAEARR
:::.:. : ::::.. . .. :
CCDS11 RPLWATVLALGALAGVGVGGPNICTTRGVSSCQQCLAVSPMCAWCSDEALPLGSP----R
10 20 30 40 50 60
80 90 100 110 120 130
pF1KB3 CARREELLARGCPLEELEEPRGQQEVLQDQPLSQGARGEGA--TQLAPQRVRVTLRPGEP
: .:.:: .: : .: : .. .::.:.:::. . :... ::..:::. . ::: .
CCDS11 CDLKENLLKDNCAPESIEFPVSEARVLEDRPLSDKGSGDSSQVTQVSPQRIALRLRPDDS
70 80 90 100 110 120
140 150 160 170 180 190
pF1KB3 QQLQVRFLRAEGYPVDLYYLMDLSYSMKDDLERVRQLGHALLVRLQEVTHSVRIGFGSFV
...... ..: ::::.:::::::::::::: ...:: : ......: ..:::::.::
CCDS11 KNFSIQVRQVEDYPVDIYYLMDLSYSMKDDLWSIQNLGTKLATQMRKLTSNLRIGFGAFV
130 140 150 160 170 180
200 210 220 230 240 250
pF1KB3 DKTVLPFVSTVPSK-LRHPCPTRLERCQSPFSFHHVLSLTGDAQAFEREVGRQSVSGNLD
:: : :.. : . :..:: : :...:::.:: .. :..:: .:::: : :
CCDS11 DKPVSPYMYISPPEALENPCYDMKTTCLPMFGYKHVLTLTDQVTRFNEEVKKQSVSRNRD
190 200 210 220 230 240
260 270 280 290 300 310
pF1KB3 SPEGGFDAILQAALCQEQIGWRN-VSRLLVFTSDDTFHTAGDGKLGGIFMPSDGHCHLDS
.::::::::.::..:.:.::::: .:.:::::.: : : ::.:.:: .:.::.::. :
CCDS11 APEGGFDAIMQATVCDEKIGWRNDASHLLVFTTDAKTHIALDGRLAGIVQPNDGQCHVGS
250 260 270 280 290 300
320 330 340 350 360 370
pF1KB3 NGLYSRSTEFDYPSVGQVAQALSAANIQPIFAVTSAALPVYQELSKLIPKSAVGELSEDS
.. :: :: .::::.: ... :: ::. ::::: .. .::. :.::: ..:: :: ::
CCDS11 DNHYSASTTMDYPSLGLMTEKLSQKNINLIFAVTENVVNLYQNYSELIPGTTVGVLSMDS
310 320 330 340 350 360
380 390 400 410 420 430
pF1KB3 SNVVQLIMDAYNSLSSTVTLEHSSLPPGVHISYESQCEGPEKREGKAEDRGQCNHVRINQ
:::.:::.:::... : : :: .:: . .:... : . : : .: ..:..
CCDS11 SNVLQLIVDAYGKIRSKVELEVRDLPEELSLSFNATCLNNEVIPGLK----SCMGLKIGD
370 380 390 400 410
440 450 460 470 480 490
pF1KB3 TVTFWVSLQATHCLPEPHL-LRLRALGFSEELIVELHTLCDCNC-SDTQPQAPHCSDGQG
::.: . .. : : . . .. .::.. :::.. ::: : ....:.. .:..:.:
CCDS11 TVSFSIEAKVRGCPQEKEKSFTIKPVGFKDSLIVQVTFDCDCACQAQAEPNSHRCNNGNG
420 430 440 450 460 470
500 510 520 530 540 550
pF1KB3 HLQCGVCSCAPGRLGRLCECSVAELSSPDLESGCRAPNGTGPLCSGKGHCQCGRCSCS--
..:::: :.:: :: :::: : :. .. : .: :.:: .:.: ::.: :
CCDS11 TFECGVCRCGPGWLGSQCECS-EEDYRPSQQDEC-SPREGQPVCSQRGECLCGQCVCHSS
480 490 500 510 520 530
560 570 580 590 600
pF1KB3 --GQSSGHLCECDDASCERHEGILCGGFGRCQCGVCHCHANRTGRACECSGDMDSCISPE
:. .:. ::::: :: :..: .:.: :.:.:: : : .. :: :.:. :.:.: .
CCDS11 DFGKITGKYCECDDFSCVRYKGEMCSGHGQCSCGDCLCDSDWTGYYCNCTTRTDTCMSSN
540 550 560 570 580 590
610 620 630 640 650 660
pF1KB3 GGLCSGHGRCKCNRCQCLD-GYYGALCDQCPGCKTPCERHRDCAECGAFRTGPL--ATNC
: ::::.:.:.:. : :.. : :: :..:: : : ...:.:: : : : ..:
CCDS11 GLLCSGRGKCECGSCVCIQPGSYGDTCEKCPTCPDACTFKKECVECKKFDRGALHDENTC
600 610 620 630 640 650
670 680 690 700 710
pF1KB3 STACAHTNVTLALAPILDDGW----CKERTLDNQLFFFLVEDDARGTVVLRV--RPQ-EK
. : . .. . : : : .. :. . : .:. : .: : .:. :
CCDS11 NRYC--RDEIESVKELKDTGKDAVNCTYKNEDDCVVRFQYYEDSSGKSILYVVEEPECPK
660 670 680 690 700 710
720 730 740 750 760 770
pF1KB3 GADHTQAIVLGCVGGIVAVGLGLVLAYRLSVEIYDRREYSRFEKEQQQLNWKQDSNPLYK
: : ...:. .:.:. .::. .: ..: . :.::.:...::.:. . .: .:::::
CCDS11 GPD-ILVVLLSVMGAILLIGLAALLIWKLLITIHDRKEFAKFEEERARAKWDTANNPLYK
720 730 740 750 760 770
780 790
pF1KB3 SAITTTINPRFQEADSPTL
: .: : ..
CCDS11 EATSTFTNITYRGT
780
>>CCDS2212.1 ITGB6 gene_id:3694|Hs108|chr2 (788 aa)
initn: 1417 init1: 581 opt: 2054 Z-score: 1466.2 bits: 282.1 E(32554): 2.4e-75
Smith-Waterman score: 2054; 39.6% identity (68.1% similar) in 775 aa overlap (35-791:15-775)
10 20 30 40 50 60
pF1KB3 PMVLVLLLVLSRGESELDAKIPSTGDATEWRNPHLSMLGSCQ--PAPSCQKCILSHPSCA
:: :.. :.: : .:. :.: :.::
CCDS22 MGIELLCLFFLFLGRNDHVQ--GGCALGGAETCEDCLLIGPQCA
10 20 30 40
70 80 90 100 110 120
pF1KB3 WCKQLNFT-ASGEAEARRCARREELLARGCPLEELEEPRGQQEVLQDQPLSQGARGEGA-
:: : ::: :: .: :: .:::.:: :. .:.: .: :.:...::: : . ...
CCDS22 WCAQENFTHPSGVGE--RCDTPANLLAKGCQLNFIENPVSQVEILKNKPLSVGRQKNSSD
50 60 70 80 90 100
130 140 150 160 170
pF1KB3 -TQLAPQRVRVTLRPGEPQQLQVRFLRAEGYPVDLYYLMDLSYSMKDDLERVRQLGHALL
.:.::: . . :::: : :::. ..: :::::::::::: :: :::. ...:: :
CCDS22 IVQIAPQSLILKLRPGGAQTLQVHVRQTEDYPVDLYYLMDLSASMDDDLNTIKELGSRLS
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB3 VRLQEVTHSVRIGFGSFVDKTVLPFVSTVPSKLRHPCPTRLERCQSPFSFHHVLSLTGDA
.....: . :.::::::.: : :::.:.: .. .:: . : :.:.:.: ::.::
CCDS22 KEMSKLTSNFRLGFGSFVEKPVSPFVKTTPEEIANPCSSIPYFCLPTFGFKHILPLTNDA
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB3 QAFEREVGRQSVSGNLDSPEGGFDAILQAALCQEQIGWRNVS-RLLVFTSDDTFHTAGDG
. :.. : :..:.:.:.::::::::.:::.:.:.::::: : .::::.:: : . :.
CCDS22 ERFNEIVKNQKISANIDTPEGGFDAIMQAAVCKEKIGWRNDSLHLLVFVSDADSHFGMDS
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB3 KLGGIFMPSDGHCHLDSNGLYSRSTEFDYPSVGQVAQALSAANIQPIFAVTSAALPVYQE
::.:: .:.:: :::::.. :: :: ..::..::. . : :. :::::. . .:..
CCDS22 KLAGIVIPNDGLCHLDSKNEYSMSTVLEYPTIGQLIDKLVQNNVLLIFAVTQEQVHLYEN
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB3 LSKLIPKSAVGELSEDSSNVVQLIMDAYNSLSSTVTLEHSSLPPGVHISYESQCEGPEKR
.:::: ..:: :..::.:..:::..::. : : : :: . :...:. . :..
CCDS22 YAKLIPGATVGLLQKDSGNILQLIISAYEELRSEVELEVLGDTEGLNLSFTAICNNGTLF
350 360 370 380 390 400
420 430 440 450 460 470
pF1KB3 EGKAEDRGQCNHVRINQTVTFWVSLQATHCLPEPHLLRLRALGFSEELIVELHTLCDCNC
. . .:.:.....:..: :... :: . . . .. .:... : . . :.:.:
CCDS22 QHQK----KCSHMKVGDTASFSVTVNIPHCERRSRHIIIKPVGLGDALELLVSPECNCDC
410 420 430 440 450
480 490 500 510 520 530
pF1KB3 S-DTQPQAPHCSDGQGHLQCGVCSCAPGRLGRLCECSVAELSSPDLESGCR-APNGTGPL
. ... .. .: :.: .:::::.: ::..: :::. ::. ..:. ::. :
CCDS22 QKEVEVNSSKCHHGNGSFQCGVCACHPGHMGPRCECGEDMLST----DSCKEAPDH--PS
460 470 480 490 500 510
540 550 560 570 580 590
pF1KB3 CSGKGHCQCGRCSCS----GQSSGHLCECDDASCERHEGILCGGFGRCQCGVCHCHANRT
:::.: : ::.: : :. : :.::. :: ::.:.:::: : :.:: : :... :
CCDS22 CSGRGDCYCGQCICHLSPYGNIYGPYCQCDNFSCVRHKGLLCGGNGDCDCGECVCRSGWT
520 530 540 550 560 570
600 610 620 630 640 650
pF1KB3 GRACECSGDMDSCISPEGGLCSGHGRCKCNRCQCLD-GYYGALCDQCPGCKTPCERHRDC
:. :.:. . :::.: .: ::::.: : :..: : . : : :..:: : ::. .:.:
CCDS22 GEYCNCTTSTDSCVSEDGVLCSGRGDCVCGKCVCTNPGASGPTCERCPTCGDPCNSKRSC
580 590 600 610 620 630
660 670 680 690 700
pF1KB3 AECGAFRTGPLATNCSTACAHTNVTLALAPILD-DGW--CKERTLDNQLFFFLVEDDARG
:: .: .: : ...:.. .. :: :. . .. :. ::. : .:
CCDS22 IECHLSAAGQAREECVDKCKLAGATISEEEDFSKDGSVSCSLQGENECLITFLITTDNEG
640 650 660 670 680 690
710 720 730 740 750 760
pF1KB3 -TVVLRVRPQE-KGADHTQAIVLGCVGGIVAVGLGLVLAYRLSVEIYDRREYSRFEKEQQ
:.. . .. . :.:: .:. .:. :. ..: : ..::.: ..:: :..
CCDS22 KTIIHSINEKDCPKPPNIPMIMLGVSLAILLIGVVLLCIWKLLVSFHDRKEVAKFEAERS
700 710 720 730 740 750
770 780 790
pF1KB3 QLNWKQDSNPLYKSAITTTINPRFQEADSPTL
. .:. .::::... .: : ..
CCDS22 KAKWQTGTNPLYRGSTSTFKNVTYKHREKQKVDLSTDC
760 770 780
>>CCDS3030.1 ITGB5 gene_id:3693|Hs108|chr3 (799 aa)
initn: 1204 init1: 637 opt: 2043 Z-score: 1458.4 bits: 280.7 E(32554): 6.5e-75
Smith-Waterman score: 2043; 40.2% identity (68.5% similar) in 781 aa overlap (37-792:20-789)
10 20 30 40 50 60
pF1KB3 VLVLLLVLSRGESELDAKIPSTGDATEWRNPHLSMLGSCQP--APSCQKCILSHPSCAWC
:.:. :. : : ::..:.: ::.::::
CCDS30 MPRAPAPLYACLLGLCALLPRLAGLNICTSGSATSCEECLLIHPKCAWC
10 20 30 40
70 80 90 100 110 120
pF1KB3 KQLNFTASGEAEARRCARREELLARGCPLEELEEPRGQQEVLQDQPLSQ---GARGEGAT
.. .: .: .. . :: : .:. :: :.: : .. .::.. :::. :. : .
CCDS30 SKEDF-GSPRSITSRCDLRANLVKNGCG-GEIESPASSFHVLRSLPLSSKGSGSAGWDVI
50 60 70 80 90 100
130 140 150 160 170 180
pF1KB3 QLAPQRVRVTLRPGEPQQLQVRFLRAEGYPVDLYYLMDLSYSMKDDLERVRQLGHALLVR
:..::.. :.::::. .:.. ..: :::::::::::: ::::::. .:.:: : .
CCDS30 QMTPQEIAVNLRPGDKTTFQLQVRQVEDYPVDLYYLMDLSLSMKDDLDNIRSLGTKLAEE
110 120 130 140 150 160
190 200 210 220 230
pF1KB3 LQEVTHSVRIGFGSFVDKTVLPFVSTVPSKLRHPCPTR--LERCQSPFSFHHVLSLTGDA
....: . :.:::::::: . :: :.: .:: . : :.:.:.: :: .
CCDS30 MRKLTSNFRLGFGSFVDKDISPFSYTAPRYQTNPCIGYKLFPNCVPSFGFRHLLPLTDRV
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB3 QAFEREVGRQSVSGNLDSPEGGFDAILQAALCQEQIGWR-NVSRLLVFTSDDTFHTAGDG
..:..:: .: :: : :.:::::::.::::.:.:.:::: .. .:::::.::. : : ::
CCDS30 DSFNEEVRKQRVSRNRDAPEGGFDAVLQAAVCKEKIGWRKDALHLLVFTTDDVPHIALDG
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB3 KLGGIFMPSDGHCHLDSNGLYSRSTEFDYPSVGQVAQALSAANIQPIFAVTSAALPVYQE
::::. .: ::.:::. . :. :...::::.. ... :. ::. :::::. .:..
CCDS30 KLGGLVQPHDGQCHLNEANEYTASNQMDYPSLALLGEKLAENNINLIFAVTKNHYMLYKN
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB3 LSKLIPKSAVGELSEDSSNVVQLIMDAYNSLSSTVTLEHSSLPPGVHISYESQCEGPEKR
.. ::: ..: :. ::.:..:::..::::. : : : . : ... . . :. .
CCDS30 FTALIPGTTVEILDGDSKNIIQLIINAYNSIRSKVELSVWDQPEDLNLFFTATCQDGVSY
350 360 370 380 390 400
420 430 440 450 460 470
pF1KB3 EGKAEDRGQCNHVRINQTVTFWVSLQATHCLPE---PHLLRLRALGFSEELIVELHTLCD
:. .:. ..:..:..: :::.: : : :.. :: .:: . : : . :
CCDS30 PGQR----KCEGLKIGDTASFEVSLEARSC-PSRHTEHVFALRPVGFRDSLEVGVTYNCT
410 420 430 440 450 460
480 490 500 510 520 530
pF1KB3 CNCS-DTQPQAPHCSDGQGHLQCGVCSCAPGRLGRLCECSVAELSSPDLESGCRAPNGTG
:.:: .:.. .: .:.: ::.: :.:: :: :::. .: .: .. :: .:
CCDS30 CGCSVGLEPNSARC-NGSGTYVCGLCECSPGYLGTRCECQDGENQSV-YQNLCREAEGK-
470 480 490 500 510
540 550 560 570 580 590
pF1KB3 PLCSGKGHCQCGRCSCS----GQSSGHLCECDDASCERHEGILCGGFGRCQCGVCHCHAN
:::::.: :.:..::: :. : .::::. :: :..:.::.: :.:.:: :.:::.
CCDS30 PLCSGRGDCSCNQCSCFESEFGKIYGPFCECDNFSCARNKGVLCSGHGECHCGECKCHAG
520 530 540 550 560 570
600 610 620 630 640
pF1KB3 RTGRACECSGDMDSCISPEGGLCSGHGRCKCNRCQCLD-GYYGALCDQCPGCKTPCERHR
: :.:: :...: . .: .:: .:.: :..::: . : .: .:..:: : : .:
CCDS30 YIGDNCNCSTDISTCRGRDGQICSERGHCLCGQCQCTEPGAFGEMCEKCPTCPDACSTKR
580 590 600 610 620 630
650 660 670 680 690 700
pF1KB3 DCAECGAFRTG-PLATNCSTACAHTNVTLALAPILDDG---WCKERTL-DNQLFFFLVE-
::.:: ...: : .: . : .: . . . :: : .: : ..: ::
CCDS30 DCVECLLLHSGKPDNQTCHSLCRDEVITWVDTIVKDDQEAVLCFYKTAKDCVMMFTYVEL
640 650 660 670 680 690
710 720 730 740 750 760
pF1KB3 -DDARGTVVLRVRPQEKGADHTQAIVLGCVGGIVAVGLGLVLAYRLSVEIYDRREYSRFE
. . .::: .:. .. ....:.:. ::.:. :::.:. ..: : :.::::...:.
CCDS30 PSGKSNLTVLR-EPECGNTPNAMTILLAVVGSILLVGLALLAIWKLLVTIHDRREFAKFQ
700 710 720 730 740 750
770 780 790
pF1KB3 KEQQQLNWKQDSNPLYKSAITT-TINPRFQEADSPTL
.:... ... :::::.. :.: :.. :..
CCDS30 SERSRARYEMASNPLYRKPISTHTVDFTFNKFNKSYNGTVD
760 770 780 790
>>CCDS74596.1 ITGB6 gene_id:3694|Hs108|chr2 (746 aa)
initn: 1389 init1: 581 opt: 1946 Z-score: 1390.2 bits: 268.0 E(32554): 4.1e-71
Smith-Waterman score: 1946; 39.5% identity (68.4% similar) in 740 aa overlap (68-791:6-733)
40 50 60 70 80 90
pF1KB3 HLSMLGSCQPAPSCQKCILSHPSCAWCKQLNFT-ASGEAEARRCARREELLARGCPLEEL
::: :: .: :: .:::.:: :. .
CCDS74 MITYKNFTHPSGVGE--RCDTPANLLAKGCQLNFI
10 20 30
100 110 120 130 140 150
pF1KB3 EEPRGQQEVLQDQPLSQGARGEGA--TQLAPQRVRVTLRPGEPQQLQVRFLRAEGYPVDL
:.: .: :.:...::: : . ... .:.::: . . :::: : :::. ..: :::::
CCDS74 ENPVSQVEILKNKPLSVGRQKNSSDIVQIAPQSLILKLRPGGAQTLQVHVRQTEDYPVDL
40 50 60 70 80 90
160 170 180 190 200 210
pF1KB3 YYLMDLSYSMKDDLERVRQLGHALLVRLQEVTHSVRIGFGSFVDKTVLPFVSTVPSKLRH
::::::: :: :::. ...:: : .....: . :.::::::.: : :::.:.: .. .
CCDS74 YYLMDLSASMDDDLNTIKELGSRLSKEMSKLTSNFRLGFGSFVEKPVSPFVKTTPEEIAN
100 110 120 130 140 150
220 230 240 250 260 270
pF1KB3 PCPTRLERCQSPFSFHHVLSLTGDAQAFEREVGRQSVSGNLDSPEGGFDAILQAALCQEQ
:: . : :.:.:.: ::.::. :.. : :..:.:.:.::::::::.:::.:.:.
CCDS74 PCSSIPYFCLPTFGFKHILPLTNDAERFNEIVKNQKISANIDTPEGGFDAIMQAAVCKEK
160 170 180 190 200 210
280 290 300 310 320 330
pF1KB3 IGWRNVS-RLLVFTSDDTFHTAGDGKLGGIFMPSDGHCHLDSNGLYSRSTEFDYPSVGQV
::::: : .::::.:: : . :.::.:: .:.:: :::::.. :: :: ..::..::.
CCDS74 IGWRNDSLHLLVFVSDADSHFGMDSKLAGIVIPNDGLCHLDSKNEYSMSTVLEYPTIGQL
220 230 240 250 260 270
340 350 360 370 380 390
pF1KB3 AQALSAANIQPIFAVTSAALPVYQELSKLIPKSAVGELSEDSSNVVQLIMDAYNSLSSTV
. : :. :::::. . .:.. .:::: ..:: :..::.:..:::..::. : : :
CCDS74 IDKLVQNNVLLIFAVTQEQVHLYENYAKLIPGATVGLLQKDSGNILQLIISAYEELRSEV
280 290 300 310 320 330
400 410 420 430 440 450
pF1KB3 TLEHSSLPPGVHISYESQCEGPEKREGKAEDRGQCNHVRINQTVTFWVSLQATHCLPEPH
:: . :...:. . :.. . . .:.:.....:..: :... :: . .
CCDS74 ELEVLGDTEGLNLSFTAICNNGTLFQHQK----KCSHMKVGDTASFSVTVNIPHCERRSR
340 350 360 370 380
460 470 480 490 500 510
pF1KB3 LLRLRALGFSEELIVELHTLCDCNCS-DTQPQAPHCSDGQGHLQCGVCSCAPGRLGRLCE
. .. .:... : . . :.:.:. ... .. .: :.: .:::::.: ::..: ::
CCDS74 HIIIKPVGLGDALELLVSPECNCDCQKEVEVNSSKCHHGNGSFQCGVCACHPGHMGPRCE
390 400 410 420 430 440
520 530 540 550 560
pF1KB3 CSVAELSSPDLESGCR-APNGTGPLCSGKGHCQCGRCSCS----GQSSGHLCECDDASCE
:. ::. ..:. ::. : :::.: : ::.: : :. : :.::. ::
CCDS74 CGEDMLST----DSCKEAPDH--PSCSGRGDCYCGQCICHLSPYGNIYGPYCQCDNFSCV
450 460 470 480 490 500
570 580 590 600 610 620
pF1KB3 RHEGILCGGFGRCQCGVCHCHANRTGRACECSGDMDSCISPEGGLCSGHGRCKCNRCQCL
::.:.:::: : :.:: : :... ::. :.:. . :::.: .: ::::.: : :..: :
CCDS74 RHKGLLCGGNGDCDCGECVCRSGWTGEYCNCTTSTDSCVSEDGVLCSGRGDCVCGKCVCT
510 520 530 540 550 560
630 640 650 660 670 680
pF1KB3 D-GYYGALCDQCPGCKTPCERHRDCAECGAFRTGPLATNCSTACAHTNVTLALAPILD-D
. : : :..:: : ::. .:.: :: .: .: : ...:.. .. :
CCDS74 NPGASGPTCERCPTCGDPCNSKRSCIECHLSAAGQAREECVDKCKLAGATISEEEDFSKD
570 580 590 600 610 620
690 700 710 720 730 740
pF1KB3 GW--CKERTLDNQLFFFLVEDDARG-TVVLRVRPQE-KGADHTQAIVLGCVGGIVAVGLG
: :. . .. :. ::. : .: :.. . .. . :.:: .:. .:.
CCDS74 GSVSCSLQGENECLITFLITTDNEGKTIIHSINEKDCPKPPNIPMIMLGVSLAILLIGVV
630 640 650 660 670 680
750 760 770 780 790
pF1KB3 LVLAYRLSVEIYDRREYSRFEKEQQQLNWKQDSNPLYKSAITTTINPRFQEADSPTL
:. ..: : ..::.: ..:: :... .:. .::::... .: : ..
CCDS74 LLCIWKLLVSFHDRKEVAKFEAERSKAKWQTGTNPLYRGSTSTFKNVTYKHREKQKVDLS
690 700 710 720 730 740
CCDS74 TDC
>>CCDS74597.1 ITGB6 gene_id:3694|Hs108|chr2 (693 aa)
initn: 1236 init1: 532 opt: 1786 Z-score: 1277.6 bits: 247.1 E(32554): 7.6e-65
Smith-Waterman score: 1786; 39.1% identity (68.2% similar) in 670 aa overlap (135-791:21-680)
110 120 130 140 150 160
pF1KB3 VLQDQPLSQGARGEGATQLAPQRVRVTLRPGEPQQLQVRFLRAEGYPVDLYYLMDLSYSM
: : :::. ..: :::::::::::: ::
CCDS74 MGIELLCLFFLFLGRNDHVQGGAQTLQVHVRQTEDYPVDLYYLMDLSASM
10 20 30 40 50
170 180 190 200 210 220
pF1KB3 KDDLERVRQLGHALLVRLQEVTHSVRIGFGSFVDKTVLPFVSTVPSKLRHPCPTRLERCQ
:::. ...:: : .....: . :.::::::.: : :::.:.: .. .:: . :
CCDS74 DDDLNTIKELGSRLSKEMSKLTSNFRLGFGSFVEKPVSPFVKTTPEEIANPCSSIPYFCL
60 70 80 90 100 110
230 240 250 260 270 280
pF1KB3 SPFSFHHVLSLTGDAQAFEREVGRQSVSGNLDSPEGGFDAILQAALCQEQIGWRNVS-RL
:.:.:.: ::.::. :.. : :..:.:.:.::::::::.:::.:.:.::::: : .:
CCDS74 PTFGFKHILPLTNDAERFNEIVKNQKISANIDTPEGGFDAIMQAAVCKEKIGWRNDSLHL
120 130 140 150 160 170
290 300 310 320 330 340
pF1KB3 LVFTSDDTFHTAGDGKLGGIFMPSDGHCHLDSNGLYSRSTEFDYPSVGQVAQALSAANIQ
:::.:: : . :.::.:: .:.:: :::::.. :: :: ..::..::. . : :.
CCDS74 LVFVSDADSHFGMDSKLAGIVIPNDGLCHLDSKNEYSMSTVLEYPTIGQLIDKLVQNNVL
180 190 200 210 220 230
350 360 370 380 390 400
pF1KB3 PIFAVTSAALPVYQELSKLIPKSAVGELSEDSSNVVQLIMDAYNSLSSTVTLEHSSLPPG
:::::. . .:.. .:::: ..:: :..::.:..:::..::. : : : :: . :
CCDS74 LIFAVTQEQVHLYENYAKLIPGATVGLLQKDSGNILQLIISAYEELRSEVELEVLGDTEG
240 250 260 270 280 290
410 420 430 440 450 460
pF1KB3 VHISYESQCEGPEKREGKAEDRGQCNHVRINQTVTFWVSLQATHCLPEPHLLRLRALGFS
...:. . :.. . . .:.:.....:..: :... :: . . . .. .:..
CCDS74 LNLSFTAICNNGTLFQHQK----KCSHMKVGDTASFSVTVNIPHCERRSRHIIIKPVGLG
300 310 320 330 340
470 480 490 500 510 520
pF1KB3 EELIVELHTLCDCNCS-DTQPQAPHCSDGQGHLQCGVCSCAPGRLGRLCECSVAELSSPD
. : . . :.:.:. ... .. .: :.: .:::::.: ::..: :::. ::.
CCDS74 DALELLVSPECNCDCQKEVEVNSSKCHHGNGSFQCGVCACHPGHMGPRCECGEDMLST--
350 360 370 380 390 400
530 540 550 560 570
pF1KB3 LESGCR-APNGTGPLCSGKGHCQCGRCSCS----GQSSGHLCECDDASCERHEGILCGGF
..:. ::. : :::.: : ::.: : :. : :.::. :: ::.:.::::
CCDS74 --DSCKEAPDH--PSCSGRGDCYCGQCICHLSPYGNIYGPYCQCDNFSCVRHKGLLCGGN
410 420 430 440 450 460
580 590 600 610 620 630
pF1KB3 GRCQCGVCHCHANRTGRACECSGDMDSCISPEGGLCSGHGRCKCNRCQCLD-GYYGALCD
: :.:: : :... ::. :.:. . :::.: .: ::::.: : :..: : . : : :.
CCDS74 GDCDCGECVCRSGWTGEYCNCTTSTDSCVSEDGVLCSGRGDCVCGKCVCTNPGASGPTCE
470 480 490 500 510 520
640 650 660 670 680 690
pF1KB3 QCPGCKTPCERHRDCAECGAFRTGPLATNCSTACAHTNVTLALAPILD-DGW--CKERTL
.:: : ::. .:.: :: .: .: : ...:.. .. :: :. .
CCDS74 RCPTCGDPCNSKRSCIECHLSAAGQAREECVDKCKLAGATISEEEDFSKDGSVSCSLQGE
530 540 550 560 570 580
700 710 720 730 740 750
pF1KB3 DNQLFFFLVEDDARG-TVVLRVRPQE-KGADHTQAIVLGCVGGIVAVGLGLVLAYRLSVE
.. :. ::. : .: :.. . .. . :.:: .:. .:. :. ..: :
CCDS74 NECLITFLITTDNEGKTIIHSINEKDCPKPPNIPMIMLGVSLAILLIGVVLLCIWKLLVS
590 600 610 620 630 640
760 770 780 790
pF1KB3 IYDRREYSRFEKEQQQLNWKQDSNPLYKSAITTTINPRFQEADSPTL
..::.: ..:: :... .:. .::::... .: : ..
CCDS74 FHDRKEVAKFEAERSKAKWQTGTNPLYRGSTSTFKNVTYKHREKQKVDLSTDC
650 660 670 680 690
>>CCDS63040.1 ITGB6 gene_id:3694|Hs108|chr2 (681 aa)
initn: 1485 init1: 569 opt: 1568 Z-score: 1123.7 bits: 218.6 E(32554): 2.8e-56
Smith-Waterman score: 1568; 42.3% identity (70.3% similar) in 565 aa overlap (35-584:15-565)
10 20 30 40 50 60
pF1KB3 PMVLVLLLVLSRGESELDAKIPSTGDATEWRNPHLSMLGSCQ--PAPSCQKCILSHPSCA
:: :.. :.: : .:. :.: :.::
CCDS63 MGIELLCLFFLFLGRNDHVQ--GGCALGGAETCEDCLLIGPQCA
10 20 30 40
70 80 90 100 110 120
pF1KB3 WCKQLNFT-ASGEAEARRCARREELLARGCPLEELEEPRGQQEVLQDQPLSQGARGEGA-
:: : ::: :: .: :: .:::.:: :. .:.: .: :.:...::: : . ...
CCDS63 WCAQENFTHPSGVGE--RCDTPANLLAKGCQLNFIENPVSQVEILKNKPLSVGRQKNSSD
50 60 70 80 90 100
130 140 150 160 170
pF1KB3 -TQLAPQRVRVTLRPGEPQQLQVRFLRAEGYPVDLYYLMDLSYSMKDDLERVRQLGHALL
.:.::: . . :::: : :::. ..: :::::::::::: :: :::. ...:: :
CCDS63 IVQIAPQSLILKLRPGGAQTLQVHVRQTEDYPVDLYYLMDLSASMDDDLNTIKELGSRLS
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB3 VRLQEVTHSVRIGFGSFVDKTVLPFVSTVPSKLRHPCPTRLERCQSPFSFHHVLSLTGDA
.....: . :.::::::.: : :::.:.: .. .:: . : :.:.:.: ::.::
CCDS63 KEMSKLTSNFRLGFGSFVEKPVSPFVKTTPEEIANPCSSIPYFCLPTFGFKHILPLTNDA
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB3 QAFEREVGRQSVSGNLDSPEGGFDAILQAALCQEQIGWRNVS-RLLVFTSDDTFHTAGDG
. :.. : :..:.:.:.::::::::.:::.:.:.::::: : .::::.:: : . :.
CCDS63 ERFNEIVKNQKISANIDTPEGGFDAIMQAAVCKEKIGWRNDSLHLLVFVSDADSHFGMDS
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB3 KLGGIFMPSDGHCHLDSNGLYSRSTEFDYPSVGQVAQALSAANIQPIFAVTSAALPVYQE
::.:: .:.:: :::::.. :: :: ..::..::. . : :. :::::. . .:..
CCDS63 KLAGIVIPNDGLCHLDSKNEYSMSTVLEYPTIGQLIDKLVQNNVLLIFAVTQEQVHLYEN
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB3 LSKLIPKSAVGELSEDSSNVVQLIMDAYNSLSSTVTLEHSSLPPGVHISYESQCEGPEKR
.:::: ..:: :..::.:..:::..::. : : : :: . :...:. . :..
CCDS63 YAKLIPGATVGLLQKDSGNILQLIISAYEELRSEVELEVLGDTEGLNLSFTAICNNGTLF
350 360 370 380 390 400
420 430 440 450 460 470
pF1KB3 EGKAEDRGQCNHVRINQTVTFWVSLQATHCLPEPHLLRLRALGFSEELIVELHTLCDCNC
. . .:.:.....:..: :... :: . . . .. .:... : . . :.:.:
CCDS63 QHQK----KCSHMKVGDTASFSVTVNIPHCERRSRHIIIKPVGLGDALELLVSPECNCDC
410 420 430 440 450
480 490 500 510 520 530
pF1KB3 S-DTQPQAPHCSDGQGHLQCGVCSCAPGRLGRLCECSVAELSSPDLESGCR-APNGTGPL
. ... .. .: :.: .:::::.: ::..: :::. ::. ..:. ::. :
CCDS63 QKEVEVNSSKCHHGNGSFQCGVCACHPGHMGPRCECGEDMLST----DSCKEAPDH--PS
460 470 480 490 500 510
540 550 560 570 580
pF1KB3 CSGKGHCQCGRCSCS----GQSSGHLCECDDASCERHEGILCGGF---GRCQCGVCHCHA
:::.: : ::.: : :. : :.::. :: ::.:.::: : : .:..
CCDS63 CSGRGDCYCGQCICHLSPYGNIYGPYCQCDNFSCVRHKGLLCGDFSKDGSVSCSLQGENE
520 530 540 550 560 570
590 600 610 620 630 640
pF1KB3 NRTGRACECSGDMDSCISPEGGLCSGHGRCKCNRCQCLDGYYGALCDQCPGCKTPCERHR
CCDS63 CLITFLITTDNEGKTIIHSINEKDCPKPPNIPMIMLGVSLAILLIGVVLLCIWKLLVSFH
580 590 600 610 620 630
>>CCDS58599.1 ITGB4 gene_id:3691|Hs108|chr17 (1752 aa)
initn: 1131 init1: 496 opt: 1376 Z-score: 983.1 bits: 193.9 E(32554): 1.9e-48
Smith-Waterman score: 1420; 36.2% identity (64.1% similar) in 654 aa overlap (40-670:25-651)
10 20 30 40 50 60
pF1KB3 LLLVLSRGESELDAKIPSTGDATEWRNPHLSMLGSCQPAP--SCQKCILSHPSCAWCKQL
.. . :. :: :: .:. .::.: .
CCDS58 MAGPRPSPWARLLLAALISVSLSGTLANRCKKAPVKSCTECVRVDKDCAYCTDE
10 20 30 40 50
70 80 90 100 110 120
pF1KB3 NFTASGEAEARRCARREELLARGCPLEELEEPRGQQEVLQDQPLSQGARGEGATQLAPQR
: . ::: . :::: :: : . ... .. .. .. : .:..::
CCDS58 MF------RDRRCNTQAELLAAGCQRESIVVMESSFQITEETQIDTTLR---RSQMSPQG
60 70 80 90 100
130 140 150 160 170 180
pF1KB3 VRVTLRPGEPQQLQVRFLRAEGYPVDLYYLMDLSYSMKDDLERVRQLGHALLVRLQEVTH
.:: ::::: ...... .. ::::: :::.: ::.:::. ....:. : :...:
CCDS58 LRVRLRPGEERHFELEVFEPLESPVDLYILMDFSNSMSDDLDNLKKMGQNLARVLSQLTS
110 120 130 140 150 160
190 200 210 220 230 240
pF1KB3 SVRIGFGSFVDKTVLPFVSTVPSKLRHPCPTRLERCQSPFSFHHVLSLTGDAQAFEREVG
. ::::.::::. .: .. : ::..: :. . ::::..:.::: :.. :. ..
CCDS58 DYTIGFGKFVDKVSVPQTDMRPEKLKEPWPNS----DPPFSFKNVISLTEDVDEFRNKLQ
170 180 190 200 210 220
250 260 270 280 290 300
pF1KB3 RQSVSGNLDSPEGGFDAILQAALCQEQIGWR-NVSRLLVFTSDDTFHTAGDGK--LGGIF
. .:::::.::::::::::.:.: ..:::: . ..::::.....:: .:: :.::.
CCDS58 GERISGNLDAPEGGFDAILQTAVCTRDIGWRPDSTHLLVFSTESAFHYEADGANVLAGIM
230 240 250 260 270 280
310 320 330 340 350 360
pF1KB3 MPSDGHCHLDSNGLYSRSTEFDYPSVGQVAQALSAANIQPIFAVTSAALPVYQELSKLIP
.: .::::..: :.. ::::: ... :. :: ::::::. . :..: .:
CCDS58 SRNDERCHLDTTGTYTQYRTQDYPSVPTLVRLLAKHNIIPIFAVTNYSYSYYEKLHTYFP
290 300 310 320 330 340
370 380 390 400 410 420
pF1KB3 KSAVGELSEDSSNVVQLIMDAYNSLSSTVTLEHSSLPPGVHISYESQCEGPEKREGKAED
:..: :.:::::.:.:. .:.: . :.. .. . : :.. :. . : :.
CCDS58 VSSLGVLQEDSSNIVELLEEAFNRIRSNLDIRALDSPRGLRTEVTSKMF-QKTRTGSF--
350 360 370 380 390
430 440 450 460 470
pF1KB3 RGQCNHVRINQTVTFWVSLQA------TH-C-LPEPHL--LRLRALGFSEELIVELHTLC
:.: ... . :.:.: :: : ::: . ..:. .::. : .. .:
CCDS58 -----HIRRGEVGIYQVQLRALEHVDGTHVCQLPEDQKGNIHLKP-SFSDGLKMDAGIIC
400 410 420 430 440 450
480 490 500 510 520 530
pF1KB3 D-CNCS-DTQPQAPHCSDGQGHLQCGVCSCAPGRLGRLCECSVAELSSPDLESGCRAPNG
: :.: . . .. .:: .: . :: : :. : :. :.::.. :: :.. : .:
CCDS58 DVCTCELQKEVRSARCS-FNGDFVCGQCVCSEGWSGQTCNCSTGSLS--DIQPCLR--EG
460 470 480 490 500
540 550 560 570 580 590
pF1KB3 TGPLCSGKGHCQCGRCSCSGQSS--GHLCECDDASCERHEGILCGGFGRCQCGVCHCHAN
:::.:.::::.: : :.. :..:: :. .: : :.::. :::. : : :. .
CCDS58 EDKPCSGRGECQCGHCVCYGEGRYEGQFCEYDNFQCPRTSGFLCNDRGRCSMGQCVCEPG
510 520 530 540 550 560
600 610 620 630 640
pF1KB3 RTGRACECSGDMDSCISPEGGLCSGHGRCKCNRCQCLDG--YYGALCDQCPGCKTP--CE
:: .:.: . .::. .::.:.:.:.:.:.::.: . : ..:. . : ::
CCDS58 WTGPSCDCPLSNATCIDSNGGICNGRGHCECGRCHCHQQSLYTDTICEINYSAIHPGLCE
570 580 590 600 610 620
650 660 670 680 690 700
pF1KB3 RHRDCAECGAFRTGPLATNCSTACAHTNVTLALAPILDDGWCKERTLDNQLFFFLVEDDA
:.:..: :. :: :
CCDS58 DLRSCVQCQAWGTGEKKGRTCEECNFKVKMVDELKRAEEVVVRCSFRDEDDDCTYSYTME
630 640 650 660 670 680
798 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 12:05:44 2016 done: Thu Nov 3 12:05:44 2016
Total Scan time: 4.020 Total Display time: 0.290
Function used was FASTA [36.3.4 Apr, 2011]