Gene Ndas_0820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0820
Symbol
ID	9244665
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1011303
End bp	1012517
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	76%
IMG OID
Product	lipid A biosynthesis acyltransferase
Protein accession	YP_003678770
Protein GI	297559796
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.539919
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0772166
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACGAAC GCACGGCCGA CCTGGCCTAC ACGGCGGGGT GGGCGATGAT CCGCCGCACG 
CCCGAGAGCG CGGGGCGGGC GCTGTTCCGA CGCCTGGCCG ACCGCTCCTG GCGCGCCCAC 
GACGAGAGCA CGCGCGGCCT GGAGCGCAAC CTGAGGCGCC TGGTCGGCCC CGGGGCCACG 
GACGCCCAGC TGCGCGCGCT CTCCCGCGCG GGAATGCGCT CCTACATGCG CTACTACTAC 
GAGATGTTCC GCCTCCCGGC GATGGGTGAG GAGTACGTCC TGGGCCGGAC CCGCGCCACC 
GGGATCGAGG TCCTGGAGGA GCACGTCCGG TCGGGCCGCG GTGTGGTCGC CGCCCTGCCC 
CACATGGGCA ACTGGGACCA CGCCGGGGCC TGGATCGCCC TGAGGGGCAC CCCCCTGACC 
ACCGTCGCGC AGCGGCTGCG CCCCGAGAGC CTGTTCCAGC GCTTCACCGC CTACCGGGAG 
TCCCTGGGCA TGGAGGTGCT GCCGCTGACC GGAGGCTCGA ACACCGTGGG CACCCTGGCC 
CGGCGGCTGC GCGGGGGCGG ACTGGTGTGC CTGCTCGCCG ACCGCGACAT CAGCGGCACC 
GGCCTGGAGG TGGACTTCTT CGGGGAGCGT GCGCGCGTGC CCGCCGGGCC CGCCGCGCTG 
GCCCTCAACA CCGGCGCGGC CCTGATGCCG GTCTCGCTGT GGTACGACGG CCCGTACTGG 
AACATCCGGG TCCACGACGA GATCCCCGTC TCCGGGGGAG CCACCCGCGC CGAGCGGGTC 
CAGGCCACGA CCCAGGAGCT GGTCCGCGTC TTCGAGGGGG CGATCGCCGA GCACCCCGAG 
GACTGGCACA TGCTCCAGCC GGTGTTCAGC GCCGACCACG CGCGTGTCTC GCGCGGCCGC 
GGAGCCGACG GCGGCGTTCC GGCCCCGGTC GCCGCCGACC GCGCGCGCGT CCCGCGAGGG 
GCGACCGCGG AGACCGCTGT GCCCGCGGTG ACGGACGAGA GCACCGCGTC GGGAGGGGCG 
GGCGACGGCA CCGCGCCGGG TGGCGCTGTC CGGGAGGACC CGGTCGGCGG CACGGTACCG 
GACGAGGGTG CGCCGGGAGG GGCGGGCGAC GCAACCGCAC CGGGCACTCG GGGCGGGTTC 
ACCGCGGCGA ACGGGGTAGG GGCCCCTCAA GGCAGCGGGG CGAGGCCCCC CGGACGAGAC 
GAACGGAACG GGTGA

Protein sequence

MDERTADLAY TAGWAMIRRT PESAGRALFR RLADRSWRAH DESTRGLERN LRRLVGPGAT 
DAQLRALSRA GMRSYMRYYY EMFRLPAMGE EYVLGRTRAT GIEVLEEHVR SGRGVVAALP 
HMGNWDHAGA WIALRGTPLT TVAQRLRPES LFQRFTAYRE SLGMEVLPLT GGSNTVGTLA 
RRLRGGGLVC LLADRDISGT GLEVDFFGER ARVPAGPAAL ALNTGAALMP VSLWYDGPYW 
NIRVHDEIPV SGGATRAERV QATTQELVRV FEGAIAEHPE DWHMLQPVFS ADHARVSRGR 
GADGGVPAPV AADRARVPRG ATAETAVPAV TDESTASGGA GDGTAPGGAV REDPVGGTVP 
DEGAPGGAGD ATAPGTRGGF TAANGVGAPQ GSGARPPGRD ERNG