FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA0759, 670 aa 1>>>pF1KSDA0759 670 - 670 aa - 670 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7274+/-0.000837; mu= 17.4383+/- 0.050 mean_var=75.5384+/-14.809, 0's: 0 Z-trim(107.9): 18 B-trim: 58 in 1/50 Lambda= 0.147567 statistics sampled from 9867 (9879) to 9867 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.677), E-opt: 0.2 (0.303), width: 16 Scan time: 3.180 The best scores are: opt bits E(32554) CCDS9852.1 ANGEL1 gene_id:23357|Hs108|chr14 ( 670) 4669 1003.7 0 CCDS1512.1 ANGEL2 gene_id:90806|Hs108|chr1 ( 544) 1065 236.4 8.3e-62 CCDS73027.1 ANGEL2 gene_id:90806|Hs108|chr1 ( 375) 1044 231.8 1.3e-60 CCDS3743.1 NOCT gene_id:25819|Hs108|chr4 ( 431) 282 69.6 1e-11 >>CCDS9852.1 ANGEL1 gene_id:23357|Hs108|chr14 (670 aa) initn: 4669 init1: 4669 opt: 4669 Z-score: 5368.4 bits: 1003.7 E(32554): 0 Smith-Waterman score: 4669; 100.0% identity (100.0% similar) in 670 aa overlap (1-670:1-670) 10 20 30 40 50 60 pF1KSD MIASCLCYLLLPATRLFRALSDAFFTCRKNVLLANSSSPQVEGDFAMAPRGPEQEECEGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 MIASCLCYLLLPATRLFRALSDAFFTCRKNVLLANSSSPQVEGDFAMAPRGPEQEECEGL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD LQQWREEGLSQVLSTASEGPLIDKGLAQSSLALLMDNPGEENAASEDRWSSRQLSDLRAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 LQQWREEGLSQVLSTASEGPLIDKGLAQSSLALLMDNPGEENAASEDRWSSRQLSDLRAA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD ENLDEPFPEMLGEEPLLEVEGVEGSMWAAIPMQSEPQYADCAALPVGALATEQWEEDPAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 ENLDEPFPEMLGEEPLLEVEGVEGSMWAAIPMQSEPQYADCAALPVGALATEQWEEDPAV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD LAWSIAPEPVPQEEASIWPFEGLGQLQPPAVEIPYHEILWREWEDFSTQPDAQGLKAGDG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 LAWSIAPEPVPQEEASIWPFEGLGQLQPPAVEIPYHEILWREWEDFSTQPDAQGLKAGDG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD PQFQFTLMSYNILAQDLMQQSSELYLHCHPDILNWNYRFVNLMQEFQHWDPDILCLQEVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 PQFQFTLMSYNILAQDLMQQSSELYLHCHPDILNWNYRFVNLMQEFQHWDPDILCLQEVQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD EDHYWEQLEPSLRMMGFTCFYKRRTGCKTDGCAVCYKPTRFRLLCASPVEYFRPGLELLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 EDHYWEQLEPSLRMMGFTCFYKRRTGCKTDGCAVCYKPTRFRLLCASPVEYFRPGLELLN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD RDNVGLVLLLQPLVPEGLGQVSVAPLCVANTHILYNPRRGDVKLAQMAILLAEVDKVARL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 RDNVGLVLLLQPLVPEGLGQVSVAPLCVANTHILYNPRRGDVKLAQMAILLAEVDKVARL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD SDGSHCPIILCGDLNSVPDSPLYNFIRDGELQYHGMPAWKVSGQEDFSHQLYQRKLQAPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 SDGSHCPIILCGDLNSVPDSPLYNFIRDGELQYHGMPAWKVSGQEDFSHQLYQRKLQAPL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD WPSSLGITDCCQYVTSCHPKRSERRKYGRDFLLRFRFCSIACQRPVGLVLMEGVTDTKPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 WPSSLGITDCCQYVTSCHPKRSERRKYGRDFLLRFRFCSIACQRPVGLVLMEGVTDTKPE 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD RPAGWAESVLEEDASELEPAFSRTVGTIQHCLHLTSVYTHFLPQRGRPEVTTMPLGLGMT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 RPAGWAESVLEEDASELEPAFSRTVGTIQHCLHLTSVYTHFLPQRGRPEVTTMPLGLGMT 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD VDYIFFSAESCENGNRTDHRLYRDGTLKLLGRLSLLSEEILWAANGLPNPFCSSDHLCLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 VDYIFFSAESCENGNRTDHRLYRDGTLKLLGRLSLLSEEILWAANGLPNPFCSSDHLCLL 610 620 630 640 650 660 670 pF1KSD ASFGMEVTAP :::::::::: CCDS98 ASFGMEVTAP 670 >>CCDS1512.1 ANGEL2 gene_id:90806|Hs108|chr1 (544 aa) initn: 1364 init1: 577 opt: 1065 Z-score: 1223.1 bits: 236.4 E(32554): 8.3e-62 Smith-Waterman score: 1285; 44.4% identity (69.6% similar) in 471 aa overlap (207-667:119-544) 180 190 200 210 220 230 pF1KSD DPAVLAWSIAPEPVPQEEASIWPFEGLGQLQPPAVEIPYHEILWREWEDFSTQPDAQGLK .: . . .. .. :.:: . .. . CCDS15 QFQYCNWRPDNLSQTSLIHLSSYVMNAEGDEPSSKRRKHQGVIKRNWEYICSHDKEKTKI 90 100 110 120 130 140 240 250 260 270 280 pF1KSD AGD---GPQ-------FQFTLMSYNILAQDLMQQSSELYLHCHPDILNWNYRFVNLMQEF :: :. :.:..::::::.:::....:.:: ::. .:.:..:: :...:. CCDS15 LGDKNVDPKCEDSENKFDFSVMSYNILSQDLLEDNSHLYRHCRRPVLHWSFRFPNILKEI 150 160 170 180 190 200 290 300 310 320 330 340 pF1KSD QHWDPDILCLQEVQEDHYWEQLEPSLRMMGFTCFYKRRTGCKTDGCAVCYKPTRFRLLCA .:.: :.::::::::::: ...:::. .:. : :: ::: : ::::.:.: ..: :: . CCDS15 KHFDADVLCLQEVQEDHYGAEIRPSLESLGYHCEYKMRTGRKPDGCAICFKHSKFSLLSV 210 220 230 240 250 260 350 360 370 380 390 400 pF1KSD SPVEYFRPGLELLNRDNVGLVLLLQPLVPEGLGQVSVAPLCVANTHILYNPRRGDVKLAQ .:::.::: . ::.:::::::::::: .: .. .::::::.::::::::.::.: CCDS15 NPVEFFRPDISLLDRDNVGLVLLLQPKIP----YAACPAICVANTHLLYNPRRGDIKLTQ 270 280 290 300 310 320 410 420 430 440 450 460 pF1KSD MAILLAEVDKVARLSDGSHCPIILCGDLNSVPDSPLYNFIRDGELQYHGMPAWKVSGQED .:.::::...::. .::: :::..:::.:::: ::::.::..:.:.:.:.: ::::::. CCDS15 LAMLLAEISSVAHQKDGSFCPIVMCGDFNSVPGSPLYSFIKEGKLNYEGLPIGKVSGQEQ 330 340 350 360 370 380 470 480 490 500 510 520 pF1KSD FSHQLYQRKLQAPLWPSSLGITDCCQYVTSCHPKRSERRKYGRDFLLRFRFCSIACQRPV :. :: :. :.:: .:::.. : : .. :: .: :. CCDS15 SSRG--QRILSIPIWPPNLGISQNCVYEVQQVPK---VEKTDSDL--------------- 390 400 410 420 530 540 550 560 570 580 pF1KSD GLVLMEGVTDTKPERPAGWAESVLEEDASELEPAFSRTVGTIQHCLHLTSVYTHFLPQRG :.:. :.. .:. . . ...:: . :.:::.:..:. : CCDS15 --------TQTQ-----------LKQ--TEVLVTAEKLSSNLQHHFSLSSVYSHYFPDTG 430 440 450 460 590 600 610 620 630 640 pF1KSD RPEVTTMPLGLGMTVDYIFFSAESCENGNRTDHRLYRDGTLKLLGRLSLLSEEILWAANG ::::: ..::::::.:::. . ... .. : ::::.:::::.:. ::..:: CCDS15 IPEVTTCHSRSAITVDYIFYSAEKEDVAGHPGAEVALVGGLKLLARLSLLTEQDLWTVNG 470 480 490 500 510 520 650 660 670 pF1KSD LPNPFCSSDHLCLLASFGMEVTAP ::: ::::: :::.: .:. CCDS15 LPNENNSSDHLPLLAKFRLEL 530 540 >>CCDS73027.1 ANGEL2 gene_id:90806|Hs108|chr1 (375 aa) initn: 1338 init1: 577 opt: 1044 Z-score: 1201.4 bits: 231.8 E(32554): 1.3e-60 Smith-Waterman score: 1256; 47.4% identity (71.9% similar) in 420 aa overlap (248-667:1-375) 220 230 240 250 260 270 pF1KSD ILWREWEDFSTQPDAQGLKAGDGPQFQFTLMSYNILAQDLMQQSSELYLHCHPDILNWNY ::::::.:::....:.:: ::. .:.:.. CCDS73 MSYNILSQDLLEDNSHLYRHCRRPVLHWSF 10 20 30 280 290 300 310 320 330 pF1KSD RFVNLMQEFQHWDPDILCLQEVQEDHYWEQLEPSLRMMGFTCFYKRRTGCKTDGCAVCYK :: :...:..:.: :.::::::::::: ...:::. .:. : :: ::: : ::::.:.: CCDS73 RFPNILKEIKHFDADVLCLQEVQEDHYGAEIRPSLESLGYHCEYKMRTGRKPDGCAICFK 40 50 60 70 80 90 340 350 360 370 380 390 pF1KSD PTRFRLLCASPVEYFRPGLELLNRDNVGLVLLLQPLVPEGLGQVSVAPLCVANTHILYNP ..: :: ..:::.::: . ::.:::::::::::: .: .. .::::::.:::: CCDS73 HSKFSLLSVNPVEFFRPDISLLDRDNVGLVLLLQPKIP----YAACPAICVANTHLLYNP 100 110 120 130 140 400 410 420 430 440 450 pF1KSD RRGDVKLAQMAILLAEVDKVARLSDGSHCPIILCGDLNSVPDSPLYNFIRDGELQYHGMP ::::.::.:.:.::::...::. .::: :::..:::.:::: ::::.::..:.:.:.:.: CCDS73 RRGDIKLTQLAMLLAEISSVAHQKDGSFCPIVMCGDFNSVPGSPLYSFIKEGKLNYEGLP 150 160 170 180 190 200 460 470 480 490 500 510 pF1KSD AWKVSGQEDFSHQLYQRKLQAPLWPSSLGITDCCQYVTSCHPKRSERRKYGRDFLLRFRF ::::::. :. :: :. :.:: .:::.. : : .. :: .: :. CCDS73 IGKVSGQEQSSRG--QRILSIPIWPPNLGISQNCVYEVQQVPKV---EKTDSDL------ 210 220 230 240 250 520 530 540 550 560 570 pF1KSD CSIACQRPVGLVLMEGVTDTKPERPAGWAESVLEEDASELEPAFSRTVGTIQHCLHLTSV :.:. .. .:. . . ...:: . :.:: CCDS73 -----------------TQTQLKQ-------------TEVLVTAEKLSSNLQHHFSLSSV 260 270 280 580 590 600 610 620 630 pF1KSD YTHFLPQRGRPEVTTMPLGLGMTVDYIFFSAESCENGNRTDHRLYRDGTLKLLGRLSLLS :.:..:. : ::::: ..::::::.:::. . ... .. : ::::.:::::. CCDS73 YSHYFPDTGIPEVTTCHSRSAITVDYIFYSAEKEDVAGHPGAEVALVGGLKLLARLSLLT 290 300 310 320 330 340 640 650 660 670 pF1KSD EEILWAANGLPNPFCSSDHLCLLASFGMEVTAP :. ::..::::: ::::: :::.: .:. CCDS73 EQDLWTVNGLPNENNSSDHLPLLAKFRLEL 350 360 370 >>CCDS3743.1 NOCT gene_id:25819|Hs108|chr4 (431 aa) initn: 150 init1: 75 opt: 282 Z-score: 323.7 bits: 69.6 E(32554): 1e-11 Smith-Waterman score: 282; 28.7% identity (59.5% similar) in 237 aa overlap (247-472:145-361) 220 230 240 250 260 270 pF1KSD EILWREWEDFSTQPDAQGLKAGDGPQFQFTLMSYNILAQDLMQQSSELYLHCHPDILNWN .:..::::: : .... ...: . :.:. CCDS37 RAVLHTRPPRFQRDFVDLRTDCPSTHPPIRVMQWNILAQAL-GEGKDNFVQCPVEALKWE 120 130 140 150 160 170 280 290 300 310 320 pF1KSD YRFVNLMQEFQHWDPDILCLQEVQEDHYWEQLEPSLRMMGF--TCFYKRRTGC------- : ...:. ..::::::::: :::.. ..: : .:. : : : . : CCDS37 ERKCLILEEILAYQPDILCLQEV--DHYFDTFQPLLSRLGYQGTFFPKPWSPCLDVEHNN 180 190 200 210 220 230 330 340 350 360 370 380 pF1KSD KTDGCAVCYKPTRFRLLCASPVEYFRPGLELLNRDNVGLVLLLQPLVPEGLGQVSVAPLC ::::. . .::.:. .. . : :. ..:... :. :. : .: CCDS37 GPDGCALFFLQNRFKLVNSANI---RLTAMTLKTNQVAIAQTLE--CKESGRQ-----FC 240 250 260 270 280 390 400 410 420 430 440 pF1KSD VANTHILYNPRRG--DVKLAQMAILLAEVDKVARLSDGSHCPIILCGDLNSVPDSPLYNF .: ::. . : : . :: :: ..... ..:.. :.:.:::.:. : .:. CCDS37 IAVTHL--KARTGWERFRSAQGCDLLQNLQNI---TQGAKIPLIVCGDFNAEPTEEVYKH 290 300 310 320 330 450 460 470 480 490 500 pF1KSD IRDGELQYHGMPAWKVSGQEDFSHQLYQRKLQAPLWPSSLGITDCCQYVTSCHPKRSERR . .. :. .. :.:. . . :. : CCDS37 FASSSLNLNS--AYKLLSADGQSEPPYTTWKIRTSGECRHTLDYIWYSKHALNVRSALDL 340 350 360 370 380 390 670 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 02:58:12 2016 done: Thu Nov 3 02:58:12 2016 Total Scan time: 3.180 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]