FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB3524, 460 aa 1>>>pF1KB3524 460 - 460 aa - 460 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.9048+/-0.000995; mu= 5.9487+/- 0.060 mean_var=151.5786+/-30.215, 0's: 0 Z-trim(109.0): 47 B-trim: 0 in 0/51 Lambda= 0.104173 statistics sampled from 10525 (10560) to 10525 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.668), E-opt: 0.2 (0.324), width: 16 Scan time: 3.360 The best scores are: opt bits E(32554) CCDS14423.1 NAP1L2 gene_id:4674|Hs108|chrX ( 460) 3078 474.6 9.6e-134 CCDS76581.1 NAP1L1 gene_id:4673|Hs108|chr12 ( 383) 815 134.4 2e-31 CCDS9013.1 NAP1L1 gene_id:4673|Hs108|chr12 ( 391) 795 131.4 1.6e-30 CCDS81715.1 NAP1L1 gene_id:4673|Hs108|chr12 ( 328) 782 129.4 5.4e-30 CCDS41599.1 NAP1L4 gene_id:4676|Hs108|chr11 ( 375) 769 127.5 2.3e-29 CCDS14465.1 NAP1L3 gene_id:4675|Hs108|chrX ( 506) 607 103.2 6.4e-22 >>CCDS14423.1 NAP1L2 gene_id:4674|Hs108|chrX (460 aa) initn: 3078 init1: 3078 opt: 3078 Z-score: 2514.6 bits: 474.6 E(32554): 9.6e-134 Smith-Waterman score: 3078; 100.0% identity (100.0% similar) in 460 aa overlap (1-460:1-460) 10 20 30 40 50 60 pF1KB3 MAESENRKELSESSQEEAGNQIMVEGLGEHLERGEDAAAGLGDDGKCGEEAAAGLGEEGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MAESENRKELSESSQEEAGNQIMVEGLGEHLERGEDAAAGLGDDGKCGEEAAAGLGEEGE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 NGEDTAAGSGEDGKKGGDTDEDSEADRPKGLIGYVLDTDFVESLPVKVKYRVLALKKLQT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 NGEDTAAGSGEDGKKGGDTDEDSEADRPKGLIGYVLDTDFVESLPVKVKYRVLALKKLQT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 RAANLESKFLREFHDIERKFAEMYQPLLEKRRQIINAIYEPTEEECEYKSDSEDCDDEEM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 RAANLESKFLREFHDIERKFAEMYQPLLEKRRQIINAIYEPTEEECEYKSDSEDCDDEEM 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 CHEEMYGNEEGMVHEYVDEDDGYEDYYYDYAVEEEEEEEEEDDIEATGEENKEEEDPKGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 CHEEMYGNEEGMVHEYVDEDDGYEDYYYDYAVEEEEEEEEEDDIEATGEENKEEEDPKGI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB3 PDFWLTVLKNVDTLTPLIKKYDEPILKLLTDIKVKLSDPGEPLSFTLEFHFKPNEYFKNE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 PDFWLTVLKNVDTLTPLIKKYDEPILKLLTDIKVKLSDPGEPLSFTLEFHFKPNEYFKNE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB3 LLTKTYVLKSKLAYYDPHPYRGTAIEYSTGCEIDWNEGKNVTLKTIKKKQKHRIWGTIRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 LLTKTYVLKSKLAYYDPHPYRGTAIEYSTGCEIDWNEGKNVTLKTIKKKQKHRIWGTIRT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB3 VTEDFPKDSFFNFFSPHGITSNGRDGNDDFLLGHNLRTYIIPRSVLFFSGDALESQQEGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 VTEDFPKDSFFNFFSPHGITSNGRDGNDDFLLGHNLRTYIIPRSVLFFSGDALESQQEGV 370 380 390 400 410 420 430 440 450 460 pF1KB3 VREVNDAIYDKIIYDNWMAAIEEVKACCKNLEALVEDIDR :::::::::::::::::::::::::::::::::::::::: CCDS14 VREVNDAIYDKIIYDNWMAAIEEVKACCKNLEALVEDIDR 430 440 450 460 >>CCDS76581.1 NAP1L1 gene_id:4673|Hs108|chr12 (383 aa) initn: 771 init1: 665 opt: 815 Z-score: 677.7 bits: 134.4 E(32554): 2e-31 Smith-Waterman score: 1043; 46.3% identity (66.7% similar) in 402 aa overlap (57-449:23-376) 30 40 50 60 70 80 pF1KB3 LGEHLERGEDAAAGLGDDGKCGEEAAAGLGEEGENGEDTAAGSGEDGKKGGDTDEDSEA- :: :.::.: . . . .. . : CCDS76 MADIDNKEQSELDQDLDDVEEVEEEETGEETKLKARQLTVQMMQNPQILAAL 10 20 30 40 50 90 100 110 120 130 140 pF1KB3 -DRPKGLIGYVLDTDFVESLPVKVKYRVLALKKLQTRAANLESKFLREFHDIERKFAEMY .: ::. : ..:::: :: :: :::.::.. :..:.:: .: ::.:::.: .: CCDS76 QERLDGLVE--TPTGYIESLPRVVKRRVNALKNLQVKCAQIEAKFYEEVHDLERKYAVLY 60 70 80 90 100 110 150 160 170 180 190 200 pF1KB3 QPLLEKRRQIINAIYEPTEEECEYKSDSEDCDDEEMCHEEMYGNEEGMVHEYVDEDDGYE :::..:: .::::::::::::::.: : :: .::. .:.. . CCDS76 QPLFDKRFEIINAIYEPTEEECEWKPDEEDEISEEL-------KEKAKI----------- 120 130 140 150 210 220 230 240 250 260 pF1KB3 DYYYDYAVEEEEEEEEEDDIEATGEENKEEEDPKGIPDFWLTVLKNVDTLTPLIKKYDEP :.:..:. :.:::::::.:::::.:::: :. .....::: CCDS76 ------------EDEKKDE---------EKEDPKGIPEFWLTVFKNVDLLSDMVQEHDEP 160 170 180 190 270 280 290 300 310 320 pF1KB3 ILKLLTDIKVKLSDPGEPLSFTLEFHFKPNEYFKNELLTKTYVLKSKLAYYDPHPYRGTA ::: : :::::.:: :.:.::.:::::.::::: ::.::::: ..:. :: . : CCDS76 ILKHLKDIKVKFSDAGQPMSFVLEFHFEPNEYFTNEVLTKTYRMRSEPDDSDPFSFDGPE 200 210 220 230 240 250 330 340 350 360 370 380 pF1KB3 IEYSTGCEIDWNEGKNVTLKTIKKKQKHRIWGTIRTVTEDFPKDSFFNFFSPHGITSNGR : :::.:::..:::::::::::::::. ::.::::. .:::::::.: . .: CCDS76 IMGCTGCQIDWKKGKNVTLKTIKKKQKHKGRGTVRTVTKTVSNDSFFNFFAPPEVPESGD 260 270 280 290 300 310 390 400 410 420 430 pF1KB3 DGND-------DFLLGHNLRTYIIPRSVLFFSGDALESQQEGVVREVNDAIYDKIIYDNW .: :: .:: :: :::::::.:.:.:.:.... .: ..: :. CCDS76 LDDDAEAILAADFEIGHFLRERIIPRSVLYFTGEAIEDDDDDYDEEGEEA-------DEG 320 330 340 350 360 440 450 460 pF1KB3 MAAIEEVKACCKNLEALVEDIDR . .::::.: : CCDS76 YQLFEEVKSCSKLFQRWLQ 370 380 >>CCDS9013.1 NAP1L1 gene_id:4673|Hs108|chr12 (391 aa) initn: 1082 init1: 656 opt: 795 Z-score: 661.4 bits: 131.4 E(32554): 1.6e-30 Smith-Waterman score: 1023; 47.1% identity (67.6% similar) in 380 aa overlap (57-427:23-361) 30 40 50 60 70 80 pF1KB3 LGEHLERGEDAAAGLGDDGKCGEEAAAGLGEEGENGEDTAAGSGEDGKKGGDTDEDSEA- :: :.::.: . . . .. . : CCDS90 MADIDNKEQSELDQDLDDVEEVEEEETGEETKLKARQLTVQMMQNPQILAAL 10 20 30 40 50 90 100 110 120 130 140 pF1KB3 -DRPKGLIGYVLDTDFVESLPVKVKYRVLALKKLQTRAANLESKFLREFHDIERKFAEMY .: ::. : ..:::: :: :: :::.::.. :..:.:: .: ::.:::.: .: CCDS90 QERLDGLVE--TPTGYIESLPRVVKRRVNALKNLQVKCAQIEAKFYEEVHDLERKYAVLY 60 70 80 90 100 110 150 160 170 180 190 200 pF1KB3 QPLLEKRRQIINAIYEPTEEECEYKSDSEDCDDEEMCHEEMYGNEEGMVHEYVDEDDGYE :::..:: .::::::::::::::.: : :: .::. .:.. . CCDS90 QPLFDKRFEIINAIYEPTEEECEWKPDEEDEISEEL-------KEKAKI----------- 120 130 140 150 210 220 230 240 250 260 pF1KB3 DYYYDYAVEEEEEEEEEDDIEATGEENKEEEDPKGIPDFWLTVLKNVDTLTPLIKKYDEP :.:..:. :.:::::::.:::::.:::: :. .....::: CCDS90 ------------EDEKKDE---------EKEDPKGIPEFWLTVFKNVDLLSDMVQEHDEP 160 170 180 190 270 280 290 300 310 320 pF1KB3 ILKLLTDIKVKLSDPGEPLSFTLEFHFKPNEYFKNELLTKTYVLKSKLAYYDPHPYRGTA ::: : :::::.:: :.:.::.:::::.::::: ::.::::: ..:. :: . : CCDS90 ILKHLKDIKVKFSDAGQPMSFVLEFHFEPNEYFTNEVLTKTYRMRSEPDDSDPFSFDGPE 200 210 220 230 240 250 330 340 350 360 370 380 pF1KB3 IEYSTGCEIDWNEGKNVTLKTIKKKQKHRIWGTIRTVTEDFPKDSFFNFFSPHGITSNGR : :::.:::..:::::::::::::::. ::.::::. .:::::::.: . .: CCDS90 IMGCTGCQIDWKKGKNVTLKTIKKKQKHKGRGTVRTVTKTVSNDSFFNFFAPPEVPESGD 260 270 280 290 300 310 390 400 410 420 430 pF1KB3 DGND-------DFLLGHNLRTYIIPRSVLFFSGDALESQQEGVVREVNDAIYDKIIYDNW .: :: .:: :: :::::::.:.:.:.:.... .: ..: CCDS90 LDDDAEAILAADFEIGHFLRERIIPRSVLYFTGEAIEDDDDDYDEEGEEADEEGEEEGDE 320 330 340 350 360 370 440 450 460 pF1KB3 MAAIEEVKACCKNLEALVEDIDR CCDS90 ENDPDYDPKKDQNPAECKQQ 380 390 >>CCDS81715.1 NAP1L1 gene_id:4673|Hs108|chr12 (328 aa) initn: 1066 init1: 656 opt: 782 Z-score: 651.9 bits: 129.4 E(32554): 5.4e-30 Smith-Waterman score: 1003; 49.4% identity (70.1% similar) in 334 aa overlap (101-427:4-298) 80 90 100 110 120 130 pF1KB3 EDGKKGGDTDEDSEADRPKGLIGYVLDTDFVESLPVKVKYRVLALKKLQTRAANLESKFL ...:: :: :: :::.::.. :..:.:: CCDS81 MADIDNLPRVVKRRVNALKNLQVKCAQIEAKFY 10 20 30 140 150 160 170 180 190 pF1KB3 REFHDIERKFAEMYQPLLEKRRQIINAIYEPTEEECEYKSDSEDCDDEEMCHEEMYGNEE .: ::.:::.: .::::..:: .::::::::::::::.: : :: .::. CCDS81 EEVHDLERKYAVLYQPLFDKRFEIINAIYEPTEEECEWKPDEEDEISEEL---------- 40 50 60 70 80 200 210 220 230 240 250 pF1KB3 GMVHEYVDEDDGYEDYYYDYAVEEEEEEEEEDDIEATGEENKEEEDPKGIPDFWLTVLKN .:. . ::. ....:.:::::::.:::::.:: CCDS81 ------------------------KEKAKIEDE-----KKDEEKEDPKGIPEFWLTVFKN 90 100 110 260 270 280 290 300 310 pF1KB3 VDTLTPLIKKYDEPILKLLTDIKVKLSDPGEPLSFTLEFHFKPNEYFKNELLTKTYVLKS :: :. .....:::::: : :::::.:: :.:.::.:::::.::::: ::.::::: ..: CCDS81 VDLLSDMVQEHDEPILKHLKDIKVKFSDAGQPMSFVLEFHFEPNEYFTNEVLTKTYRMRS 120 130 140 150 160 170 320 330 340 350 360 370 pF1KB3 KLAYYDPHPYRGTAIEYSTGCEIDWNEGKNVTLKTIKKKQKHRIWGTIRTVTEDFPKDSF . :: . : : :::.:::..:::::::::::::::. ::.::::. .::: CCDS81 EPDDSDPFSFDGPEIMGCTGCQIDWKKGKNVTLKTIKKKQKHKGRGTVRTVTKTVSNDSF 180 190 200 210 220 230 380 390 400 410 420 pF1KB3 FNFFSPHGITSNGRDGND-------DFLLGHNLRTYIIPRSVLFFSGDALESQQEGVVRE ::::.: . .: .: :: .:: :: :::::::.:.:.:.:.... .: CCDS81 FNFFAPPEVPESGDLDDDAEAILAADFEIGHFLRERIIPRSVLYFTGEAIEDDDDDYDEE 240 250 260 270 280 290 430 440 450 460 pF1KB3 VNDAIYDKIIYDNWMAAIEEVKACCKNLEALVEDIDR ..: CCDS81 GEEADEEGEEEGDEENDPDYDPKKDQNPAECKQQ 300 310 320 >>CCDS41599.1 NAP1L4 gene_id:4676|Hs108|chr11 (375 aa) initn: 1011 init1: 659 opt: 769 Z-score: 640.5 bits: 127.5 E(32554): 2.3e-29 Smith-Waterman score: 932; 45.8% identity (71.1% similar) in 325 aa overlap (98-414:53-341) 70 80 90 100 110 120 pF1KB3 GSGEDGKKGGDTDEDSEADRPKGLIGYVLDTDFVESLPVKVKYRVLALKKLQTRAANLES ....:.:: :: :. :::.::.: :..:. CCDS41 NTEKLTDQVMQNPRVLAALQERLDNVPHTPSSYIETLPKAVKRRINALKQLQVRCAHIEA 30 40 50 60 70 80 130 140 150 160 170 180 pF1KB3 KFLREFHDIERKFAEMYQPLLEKRRQIINAIYEPTEEECEYKSDSEDCDDEEMCHEEMYG :: .: ::.:::.: .::::..:::..:.. :::. : :..:..:. .:.. : CCDS41 KFYEEVHDLERKYAALYQPLFDKRREFITGDVEPTDAESEWHSENEE-------EEKLAG 90 100 110 120 130 190 200 210 220 230 240 pF1KB3 NEEGMVHEYVDEDDGYEDYYYDYAVEEEEEEEEEDDIEATGEENKEEEDPKGIPDFWLTV . .. : .: :. ::.:: ::::::.::.:. CCDS41 DMKSKV-----------------VVTEKAA--------ATAEE----PDPKGIPEFWFTI 140 150 160 250 260 270 280 290 300 pF1KB3 LKNVDTLTPLIKKYDEPILKLLTDIKVKLSDPGEPLSFTLEFHFKPNEYFKNELLTKTYV ..::: :. :...::::::: : :::::.::::.:.::.:::::.::.:: : .::::: CCDS41 FRNVDMLSELVQEYDEPILKHLQDIKVKFSDPGQPMSFVLEFHFEPNDYFTNSVLTKTYK 170 180 190 200 210 220 310 320 330 340 350 360 pF1KB3 LKSKLAYYDPHPYRGTAIEYSTGCEIDWNEGKNVTLKTIKKKQKHRIWGTIRTVTEDFPK .::. :: ..: : :: :::..:::::.:::::::::. ::.::.:.. :. CCDS41 MKSEPDKADPFSFEGPEIVDCDGCTIDWKKGKNVTVKTIKKKQKHKGRGTVRTITKQVPN 230 240 250 260 270 280 370 380 390 400 410 pF1KB3 DSFFNFFSPHGITSNGRDGNDD--------FLLGHNLRTYIIPRSVLFFSGDALESQQEG .::::::.: ...:.. ..: : .:: .: :.::.::.:.:.:.: CCDS41 ESFFNFFNPLKASGDGESLDEDSEFTLASDFEIGHFFRERIVPRAVLYFTGEAIEDDDNF 290 300 310 320 330 340 420 430 440 450 460 pF1KB3 VVREVNDAIYDKIIYDNWMAAIEEVKACCKNLEALVEDIDR CCDS41 EEGEEGEEEELEGDEEGEDEDDAEINPKV 350 360 370 >>CCDS14465.1 NAP1L3 gene_id:4675|Hs108|chrX (506 aa) initn: 910 init1: 503 opt: 607 Z-score: 507.0 bits: 103.2 E(32554): 6.4e-22 Smith-Waterman score: 756; 35.3% identity (58.0% similar) in 436 aa overlap (65-411:54-487) 40 50 60 70 80 90 pF1KB3 EDAAAGLGDDGKCGEEAAAGLGEEGENGEDTAAGSGEDGKKGGDTDEDSEADRPKGLIGY ...::: .....:.:. :. : : . CCDS14 SSTSDSGEESDSSSSSSSTSDSSSSSSTSGSSSGSGSSSSSSGSTSSRSRLYRKKRVPEP 30 40 50 60 70 80 100 110 120 130 140 pF1KB3 V-------LDTDFVESLPVKVKYRVLALKKLQTRAANLESKFLREFHDIERKFAEMYQPL : :.::. :: :. :: ::...: . .... ::. .::.:::.::. .:: CCDS14 SRRARRAPLGTNFVDRLPQAVRNRVQALRNIQDECDKVDTLFLKAIHDLERKYAELNKPL 90 100 110 120 130 140 150 160 170 180 190 pF1KB3 LEKRRQIINAIYEPTEEECEYKSDSEDCDDEEMCHEE-------MYGNEE---------- ..: ::::: :::::::::..:..:. ...: ... . :.:: CCDS14 YDRRFQIINAEYEPTEEECEWNSEDEEFSSDEEVQDNTPSEMPPLEGEEEENPKENPEVK 150 160 170 180 190 200 200 210 220 230 pF1KB3 ---GMVHEYVDE--DDGYEDYYYDYAVEEEEEEEEEDDIEATGE-------------ENK : . . : :. : :. ::. . .: .::: : ..: CCDS14 AEEKEVPKEIPEVKDEEKEVPKEIPEVKAEEKADSKDCMEATPEVKEDPKEVPQVKADDK 210 220 230 240 250 260 240 250 pF1KB3 EE----------------------------------------EDPKGIPDFWLTVLKNVD :. ::::::::.:: :::::: CCDS14 EQPKATEAKARAAVRETHKRVPEERLQDSVDLKRARKGKPKREDPKGIPDYWLIVLKNVD 270 280 290 300 310 320 260 270 280 290 300 310 pF1KB3 TLTPLIKKYDEPILKLLTDIKVKLSDPGEPLSFTLEFHFKPNEYFKNELLTKTYVLKSKL : :.:.::::::::.:.:...:.: ::.:.:.:.:::: :: ::.::.:.:::..:.: CCDS14 KLGPMIQKYDEPILKFLSDVSLKFSKPGQPVSYTFEFHFLPNPYFRNEVLVKTYIIKAKP 330 340 350 360 370 380 320 330 340 350 360 370 pF1KB3 AYYDPHPYRGTAIEYSTGCEIDWNEGKNVTLKTIKKKQKHRIWGTIRTVTEDFPKDSFFN . :: : :: ::.::: .::.::. : ... : :. . :. :::: CCDS14 DHNDPFFSWGWEIEDCKGCKIDWRRGKDVTVTTTQSRTTAT--GEIEIQPRVVPNASFFN 390 400 410 420 430 440 380 390 400 410 420 pF1KB3 FFSPHGITSNGR-----DG--NDDFLLGHNLRTYIIPRSVLFFSGDALESQQEGVVREVN :::: : :. :. ..:: .:. :. .: .:. ...:. CCDS14 FFSPPEIPMIGKLEPREDAILDEDFEIGQILHDNVILKSIYYYTGEVNGTYYQFGKHYGN 450 460 470 480 490 500 430 440 450 460 pF1KB3 DAIYDKIIYDNWMAAIEEVKACCKNLEALVEDIDR CCDS14 KKYRK 460 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 12:16:28 2016 done: Sat Nov 5 12:16:28 2016 Total Scan time: 3.360 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]