Gene Mlg_1868 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1868
Symbol
ID	4268086
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2129487
End bp	2130614
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	70%
IMG OID	638126624
Product	succinyl-diaminopimelate desuccinylase
Protein accession	YP_742702
Protein GI	114321019
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR01246] succinyl-diaminopimelate desuccinylase, proteobacterial clade

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGAGA CACTGGAACT CGCCTCCGCA CTCATCGCCC GCCGCTCGGT GACGCCCATG 
GACGCCGGCT GCCAGCAGTT GCTGGCGGAG CGATTGCGGC CCCTCGGTTT TGACTGTGAG 
CGGCTGGATT ACGGCGAGGT GAACAATCTG TGGGCCCGGC GGGGTCAGCA GGGGCCGGTG 
TTCTGTTTCG CCGGCCATAC CGATGTGGTG CCCCCGGGGC CGGAGGCCCA ATGGCGGCAC 
CCACCCTTCC AGCCGGTGGT CGAGCAGGGG CTGCTCTACG GCCGCGGCGC GGCGGACATG 
AAGGGCAGCG TCGCGGCCTT TGTCACCGCC CTGGAGCGCT ACCTGGCCGG CGGCCACCGG 
CCGCGGGGTT CGCTCGCCCT GCTGATCACC AGCGACGAGG AGGGCCCGGC GGTGGACGGC 
ACCCGGCACG TGGTCGAGAC CCTGTCCGAG CGCGGCGAGC GCATCGACTG GTGCCTGGTG 
GGTGAGCCCT CCAGCACCGA ACGCGTGGGG GATGTGGTGA AGGTGGGCCG GCGCGGGTCG 
CTCAACGGGC GGCTGACGGT GCGCGGCGAC CAGGGCCACG TGGCCTATCC CCATTTGGCG 
CGCAATCCGG TGCACCAGGC GCTGGCCGCC CTGGATGAGC TGGTCACCAC CCGCTGGGAC 
GAGGGCAACG ACCATTTCCC GCCCACCAGC TTCCAGATCT CCAACGTCCA AGCCGGCACC 
GGCGCCACCA ACGTGATCCC CGGCGAGCTG GAGGTGACGT TCAATTTCCG CTTCTCCACC 
GAGGTAACGG CGGATGAGTT ACAGCAGCGG GTAGAGGCGG TGCTGGACCG TCACGGCCTG 
GACGGGCGGA TCGACTGGTC GCTCTCGGGC GAGCCCTTTC TGACCGCGGA GGGGGAGCTG 
GTGGCCGCCA CCCAGGCGGC GGTCCGCGAT GTCTGCGGCG ACCCACCGGT GCTCTCCACT 
TCCGGCGGCA CCTCAGACGG CCGCTTCATC GCCCCCACCG GGGCCCAGGT CCTGGAGCTG 
GGGCCTGTGA ACGCCACCAT CCACAAGGTG AACGAGCACG TGCGGGCGGC GGATCTGGAC 
ACGCTGTCAA GGATTTACGA GGGCGTCCTG CGCCGACTGC TCGGCTGA

Protein sequence

MSETLELASA LIARRSVTPM DAGCQQLLAE RLRPLGFDCE RLDYGEVNNL WARRGQQGPV 
FCFAGHTDVV PPGPEAQWRH PPFQPVVEQG LLYGRGAADM KGSVAAFVTA LERYLAGGHR 
PRGSLALLIT SDEEGPAVDG TRHVVETLSE RGERIDWCLV GEPSSTERVG DVVKVGRRGS 
LNGRLTVRGD QGHVAYPHLA RNPVHQALAA LDELVTTRWD EGNDHFPPTS FQISNVQAGT 
GATNVIPGEL EVTFNFRFST EVTADELQQR VEAVLDRHGL DGRIDWSLSG EPFLTAEGEL 
VAATQAAVRD VCGDPPVLST SGGTSDGRFI APTGAQVLEL GPVNATIHKV NEHVRAADLD 
TLSRIYEGVL RRLLG