Gene Dole_2034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2034
Symbol
ID	5694877
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	2463999
End bp	2465051
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	61%
IMG OID	641264635
Product	N-acetyl-gamma-glutamyl-phosphate reductase
Protein accession	YP_001529915
Protein GI	158522045
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0002] Acetylglutamate semialdehyde dehydrogenase
TIGRFAM ID	[TIGR01850] N-acetyl-gamma-glutamyl-phosphate reductase, common form

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000233071
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAAAAA GTGGAAGCAT TCGGGCCGCG GTGGTAGGGG CCACGGGATA TGCCGGGGCC 
GAGCTGGTGC GACTGCTGGC CGGGCATTCG GATGTCACGA TCACCGCCAT TACGTCCCGC 
CAGTATGCCG GCGTCCCTTT TAACCAGGTC TATCCGGCGG TGGGAACAGC CGTTTCTCTG 
GTGTGCGAGA CGTTTGCGCC GGAACCCATC TGTGAGCGGG CCGATATCGT TTTTACCGCG 
CTTCCCCACA AACTGCCCAT GAGCATTGTG CCGGAACTGC TGGATCGGGG CGTGCGGGTG 
GTGGACCTGT CCGCCGACTT CCGGTTTTCC GATGTGGCGG CCTATGAACG CCATTACCAG 
GCCCACACCG CGAAGGAACT CTGCAAAAAG AGCGTTTACG GGCTCTGCGA GGTCTATGGG 
GAAAAGATAA AAAAGGCCGA TCTGGTGGGC AATCCGGGCT GTTATCCCAC CAGCGTTCTG 
CTGCCGCTGA TTCCGCTGGC CAGGGCCGGG CTGGTCGATA CGAAGATGAT CATCGTGGAT 
GCCAAGTCCG GTGTCAGCGG CGCGGGCCGG TCCCCGTCAT TGGGGGTCCA CTTCTGCGAG 
GTGAACGAAT CCTTCAAGGC CTATAAAGTG GCGGCTCACC GCCACGCACC GGAGATGGAG 
GAGATTCTGG GCGAAGCGGC CGGGACACCG GTCTGCCTGA CCTTTGTGCC CCACCTGGTG 
CCCATGACGC GCGGTATGCT GTCCACCATT TACGTGAACC CGGAACAGGC GGTGTCCGAG 
CAGGATGTTC GTCAGTGCCT GGCCGATTAT TACAAGGGAC GGCCTTTTGT CCGCCTGTGC 
GGGGAGGGGG CCTTTCCGGA AACCCGTTTC GTGCGGGGCA CCAATTTCTG CGACATCGGC 
GTTCGCCTGG ATACCCATGC CAACCGCCTG ATCCTGGTCT CCGCCATCGA CAACCTGGTC 
AAGGGGGCCG CCGGCCAGGC GGTTCAGAAC ATGAACCTCA TGTTTGGTGT TGACGAGGGC 
CGGGGGCTTG ATATGATACC GTTTCCGGTG TGA

Protein sequence

MLKSGSIRAA VVGATGYAGA ELVRLLAGHS DVTITAITSR QYAGVPFNQV YPAVGTAVSL 
VCETFAPEPI CERADIVFTA LPHKLPMSIV PELLDRGVRV VDLSADFRFS DVAAYERHYQ 
AHTAKELCKK SVYGLCEVYG EKIKKADLVG NPGCYPTSVL LPLIPLARAG LVDTKMIIVD 
AKSGVSGAGR SPSLGVHFCE VNESFKAYKV AAHRHAPEME EILGEAAGTP VCLTFVPHLV 
PMTRGMLSTI YVNPEQAVSE QDVRQCLADY YKGRPFVRLC GEGAFPETRF VRGTNFCDIG 
VRLDTHANRL ILVSAIDNLV KGAAGQAVQN MNLMFGVDEG RGLDMIPFPV