Gene Mlg_0204 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0204
Symbol
ID	4269650
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	237308
End bp	238369
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	69%
IMG OID	638124928
Product	succinylglutamate desuccinylase/aspartoacylase
Protein accession	YP_741049
Protein GI	114319366
COG category	[R] General function prediction only
COG ID	[COG3608] Predicted deacylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCGCC GGGCGCCCTT CCGCATCCTG GACACGGAGG TCCGCCCCGG ACAGCGCGCC 
ACGGTGGATG TGCCGCTGGC CCAACTCTAC ACCCACACCC AGCTGCACAT GCCGGTGCAG 
GTGGTGCACG GCCGACGCGA GGGGCCGGTG CTGCTGGTCA GTGCCGCGCT CCACGGCGAC 
GAGATCAACG GCGTGGAGAT CATCCGCCGG CTGCTCAAGC TCTCGGCCCT GCGCCAGCTG 
GCCGGCACTC TGGTGGCAGT GCCCATCGTC AACGTCTTCG GGTTCATCCA CCGCTCCCGC 
TACCTGCCTG ACCGGCGCGA TCTCAACCGC TGTTTCCCGG GCAGCGAGCG AGGCTCCCTG 
GGCGCCCGCA CCGCCTACCT GTTCCGCACC GGGATCGTCG AGCGCTGCAA CCACGTCATC 
GACCTGCACA CCGCCGCCAT CCATCGGGAC AACCTCCCCC AGATCCGGGT CAACCTGGAG 
AATGCCGAAG CCGCCGCCAT GGCCCGCGCC TTTGGCATGC CGCTCACCCT GAACAGTGGG 
CTGATTGAGG GCAGCCTGCG GGCGGTGGCG GACGATGCCG GCATCCCGGT GATCACCTAT 
GAGGCGGGTG AGGCCCTGCG CTTCCAGGAG CCGGCCATCA AGGCCGGACT GGCCGGCACC 
GTGCGGGTGA TGCGCAGTCT GGGTATGCTG CCGTCACGGA GCGGGCGGCA CACCGGTGGC 
TCCCGCCAGA GCTATGTCGC CAATGCCTCG CAATGGGTGC GCGCCGAACA AGACGGCATC 
TTCCGCACCG TCAGCCCTCT CGGGACCCAC GTGAAACAAA GGCAGGTACT GGGTTATATT 
GCAGACCCCT TCGGCGAGCG CGAGCTGCCC GTCCATGCGC CCTTCAGCGG GATCGTGGTG 
GGCCGCAATA ACCTGCCGCT GGTGAACGAG GGCGAGGCGC TGTACCACGT GGCCCGATAC 
GATCAGGCCG CCCGCGCCGA ACGGGTGGCG GCCCAGTGGG CCGCATTCGA GGAGGGGCTG 
AACGGCGACT ACCCGCCCTC CGAGGAGCCG CCCATCGTCT GA

Protein sequence

MARRAPFRIL DTEVRPGQRA TVDVPLAQLY THTQLHMPVQ VVHGRREGPV LLVSAALHGD 
EINGVEIIRR LLKLSALRQL AGTLVAVPIV NVFGFIHRSR YLPDRRDLNR CFPGSERGSL 
GARTAYLFRT GIVERCNHVI DLHTAAIHRD NLPQIRVNLE NAEAAAMARA FGMPLTLNSG 
LIEGSLRAVA DDAGIPVITY EAGEALRFQE PAIKAGLAGT VRVMRSLGML PSRSGRHTGG 
SRQSYVANAS QWVRAEQDGI FRTVSPLGTH VKQRQVLGYI ADPFGERELP VHAPFSGIVV 
GRNNLPLVNE GEALYHVARY DQAARAERVA AQWAAFEEGL NGDYPPSEEP PIV