Gene Mlg_1104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1104
Symbol
ID	4269811
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	1290016
End bp	1291551
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	71%
IMG OID	638125856
Product	5-oxoprolinase (ATP-hydrolyzing)
Protein accession	YP_741946
Protein GI	114320263
COG category	[E] Amino acid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0146] N-methylhydantoinase B/acetone carboxylase, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.723439
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCCGA TTGCCCTCAG TGTCTTTTCC AGCCGCATGG CCGCCGTCTG CGAGGAGATG 
GGCGCCGTGC TGCGGCGCAC CGCCTTCTCG CCCAACATCC GCGACCGGCT GGATTTTTCC 
TGCGCGGTGT TCGATGCCGA CGGCGGGCTG GCGGCGCAGG CCGCGCACAT CCCGGTGCAT 
CTGGGCAGCA TGGCCTACGC CATGGCGGGG GTGATCCGGC GCTTCGACTG GCAGCCGGGG 
GACATGGTGG TCTTTAACGA CCCCTTCCTG GGCGGTACCC ACCTGCCCGA TGTCACGCTC 
GTCTCGCCGC TGTTCGTGGA TGGCGAACGG GTCGCCTTCC TGGCCAACCG CGCCCACCAC 
GCGGATATCG GTGCGGTGAC CCCGGGCTCC ATGCCCCTGT CCACCACCCT GGAGGAGGAG 
GGGGTGCTCA TCAGTCCGGT GCGGCTCTAC CGGGCAGGCC GGCGCGACGA GGCCGTGTTG 
CAGCGCATCG TCTCGCGCAC CCGCAACCCC CGGCAGGCGG GGGGCGACTT TGCCGCCCAG 
GCCAGTTCGG TCTCCAGCGG TGTGCACCGG CTGCAGGAAC TGGTCGGGCG CATGGGGATG 
TCTGAGTTCC GGGCCGCCCT TGCGGCGTTG AACGATTACG CCGAGCGGCT GGTGCGGGCC 
GCCTTGGTGG ACCTGCCCGA CGGCAGGTGG ACCTTTACCG ACTACCTGGA TGACGACGGC 
CAGGGGCAGC AGGACCTGCC CATCCAGGTG GCCCTGACCC TCGATCACCA CGATGCCCAC 
GTGGACTTCG CCGGCTCCGC CGACCAGGTG CGGGGCAACC TGAACTGCCC CTTATCGGTG 
GCGGCCGCCG CCGTGTTCTA CGCCTTCCGC TGTCTGATGC CGGAGCAGAC CCCGGCCTGT 
GCCGGTGCCT TCCGGCCTAT CACCCTGAGC GCCCCCGAGG GCAGCCTGCT CAACGCCCGC 
CACCCGGCCG CGGTGGCTGC CGGCAATGTC GAGACCAGCC AGCGGGTGGT GGACGCGGTG 
CTGGGGGCGC TGGCGCCGGC GCTGCCGGAC CGCATCCCCG CGGCCAGCCA TGGCGGCATG 
AACAACCTGG CCATGGGGGC GCTGGCGGAG GACTCGCCCT GGGACTACTA CGAGACCCTG 
GGCGGCGGCA TGGGCGGCGG TCCCCACCAT CGCGGCCGGT CGGGCGTTCA GGTGCACATG 
ACCAATACCC TCAACACCCC CCTGGAGGCG CTGGAGATGG CCTATCCGCT GCGTCTGCGC 
CGCTATGCCC TGCGCCGTGG CTCCGGCGGT GCCGGGCGCC ATCCCGGAGG CGAGGGGGTG 
ATCCGGGAGT ACGAGTTTCT CACCCCCGCA TCGGTCACGC TGATCACCGA ACGGCGCCGC 
CATGCCCCCT GGGGGCTACA AGGTGGCGCG CCGGGCGCGG TGGGCGAGAA CCGGCTCAAC 
GGCGAGCTGC TGCCGGGCAA GGTGCGCCTG GAGGTGGCGG CCGGGGACCG GCTCACTGTC 
ATGACCCCCG GGGGTGGCGG CTGGGGCGGT TCATAG

Protein sequence

MDPIALSVFS SRMAAVCEEM GAVLRRTAFS PNIRDRLDFS CAVFDADGGL AAQAAHIPVH 
LGSMAYAMAG VIRRFDWQPG DMVVFNDPFL GGTHLPDVTL VSPLFVDGER VAFLANRAHH 
ADIGAVTPGS MPLSTTLEEE GVLISPVRLY RAGRRDEAVL QRIVSRTRNP RQAGGDFAAQ 
ASSVSSGVHR LQELVGRMGM SEFRAALAAL NDYAERLVRA ALVDLPDGRW TFTDYLDDDG 
QGQQDLPIQV ALTLDHHDAH VDFAGSADQV RGNLNCPLSV AAAAVFYAFR CLMPEQTPAC 
AGAFRPITLS APEGSLLNAR HPAAVAAGNV ETSQRVVDAV LGALAPALPD RIPAASHGGM 
NNLAMGALAE DSPWDYYETL GGGMGGGPHH RGRSGVQVHM TNTLNTPLEA LEMAYPLRLR 
RYALRRGSGG AGRHPGGEGV IREYEFLTPA SVTLITERRR HAPWGLQGGA PGAVGENRLN 
GELLPGKVRL EVAAGDRLTV MTPGGGGWGG S