Gene Mlg_2085 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2085
Symbol
ID	4269404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2362849
End bp	2364045
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	72%
IMG OID	638126841
Product	glutamate N-acetyltransferase
Protein accession	YP_742917
Protein GI	114321234
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1364] N-acetylglutamate synthase (N-acetylornithine aminotransferase)
TIGRFAM ID	[TIGR00120] glutamate N-acetyltransferase/amino-acid acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.526394
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAAC CGCAGCCGCT TCCCGTGCCC GGTGTACGGC TCGGCACGGC CCAGGCGGGT 
ATCAAGCGGG TCGGGCAACG GGACTTGGTG GTCATGGAAC TGGCCGCCGG CAGCCGCTGC 
GCCGCGGTCT TTACCCGCAA CCGCTTCTGC GCCGCACCGG TGCACGTGGC GCGCGAGCAC 
CTGGCCGCCG GTAGCCCCCG CTGGCTGCTG ATCAATACCG GCAACGCCAA CGCCGGCACC 
GGCGAGGCCG GGATGCGCGA CGCCCGCGCC TGCTGCCAGG CCCTGGCCCA GCAGGTGGGC 
GTGGCGCCCG AGGCGGTCCT GCCCTTCTCC ACCGGTGTCA TCGGTGAGCC GTTGCCGGTG 
GACCGCATCG TCGCCGGGCT GCCGGACGCG GTGGCGGCCC TGAGTGAGGC GGGCTGGCAG 
GAGGCCGGTT GGGGCATTCT CACCACCGAC ACCCGGCCCA AGCTGGCCTC AGCCACGGTC 
CAGCTGGCGG GCGGGGCGGT GACGCTGACC GGCATGGCCA AGGGCTCGGG CATGATCCGG 
CCCAACATGG CCACCATGCT GGCCTTCGTG GCCACCGACG CCGACATCCC GCAGGCCACC 
CTGCAAGGGT TGCTGGGCGA GGCGGTCGCC CAATCCTTCA ACCGGGTGAC GGTGGACGGC 
GACACCTCCA CCAACGATGC CTGTACGCTG GTGGCCACCG GCCACTCCGG TGTGGCGCTT 
GCCGGCGAGG GGGACCGTGA GCGGTTGGCC TCCGCCCTGA CCGACCTCTG CGTCACCCTG 
GCACGGGCGA TCGCCCGCGA CGGCGAGGGC GCCACCCGGC TGATCAATGT CGTCGTGGAG 
GGCGCGCAGG CGGTCGCCGA GGCCGAGCGG GTGGCCTTCA CCGTGGCCGA GTCGCCCCTG 
GTGAAGACGG CCCTGTTCGC CGCCGACCCC AACTGGGGGC GCATCCTGGC CGCGGTGGGC 
AGGGCGGGCA TCGATGATCT GGACGTCGCC GGCGTGACCA TCGACCTGGA CGATTACCGG 
ATCGCCGAAC AGGGGGGACG GGCCGCCGGG TACGATGAGG CCGAGGCCTC CCGCCGCATC 
CAGGGCTCGG AGGTGACCAT CCGCATCGGC CTGGGGCGGG GCGCGGCCGC CGCCACCGTC 
TGGACCTGCG ATTTCTCCTA CGACTACGTG CGCATCAACG CGGAGTACCG TACCTGA

Protein sequence

MSEPQPLPVP GVRLGTAQAG IKRVGQRDLV VMELAAGSRC AAVFTRNRFC AAPVHVAREH 
LAAGSPRWLL INTGNANAGT GEAGMRDARA CCQALAQQVG VAPEAVLPFS TGVIGEPLPV 
DRIVAGLPDA VAALSEAGWQ EAGWGILTTD TRPKLASATV QLAGGAVTLT GMAKGSGMIR 
PNMATMLAFV ATDADIPQAT LQGLLGEAVA QSFNRVTVDG DTSTNDACTL VATGHSGVAL 
AGEGDRERLA SALTDLCVTL ARAIARDGEG ATRLINVVVE GAQAVAEAER VAFTVAESPL 
VKTALFAADP NWGRILAAVG RAGIDDLDVA GVTIDLDDYR IAEQGGRAAG YDEAEASRRI 
QGSEVTIRIG LGRGAAAATV WTCDFSYDYV RINAEYRT