Gene Mlg_0345 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0345
Symbol
ID	4268333
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	388568
End bp	389848
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	73%
IMG OID	638125076
Product	dihydroorotase
Protein accession	YP_741190
Protein GI	114319507
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCAT GGAGCATCAC GGGGGCCCGG GTGGTGGACC CGGCCAGCGA CCGGGATGAG 
GTCGTGGATC TGCACATCGC CGATGGGCGC ATCGCCGCCC TGGGGGCACC GCCCAGCGGC 
TGGCAACCGG AGCATATCCT CCAGGCCACC GGCCTGGTGG CCTGCCCGGG GCTGATCGAC 
CTGGCGGCGC GGACCCGAGA GCCGGGGCAG GCGCGCAAGG CCAATATCGC CAGTGAGGCC 
CGGGCCGCGG CGGCCGGGGG AATCACCACG CTGATCTGCC CGCCGGACAC CCGCCCCGTC 
ACCGATACGC CTTCGGTGGT GGAGCTGATC CGCAACCGCT CCGCAGCGGC GGGCGGGGCC 
CGGGTGCTGC CGCTGGGGGC GCTGACCCGG AACCTGGACG GGGGGCAGTT GAGCGAGATG 
GTGGCCCTGA GCGAGGCGGG CTGCCCCGGG CTGTCCGACG GCGGCCGGCC GATCGCCGAC 
AGCCTGGTGC TGCGCCGGGC GCTGGAGTAC GCCGCCACCT TTGATCTGCC CGTGCACCTG 
ACCCCGGAGG AGCCCATCCT GGCCCAGGGC CTGGCCCACG AGGGGCAGCT GGCCACCCGG 
ATGGGCCTGC CCGGGATCCC GGTGGCCGCC GAGACGGCCG GGCTCGGCCG CATGCTCGCC 
CTGGCCGAGG AGATCGGGGC CCGGGTCCAC TTCGGCCGGT TGTCCAGCCG CCGCGGTCTC 
GAGCTGATCC TGGCCGCCCA GCGCAACGGT CAGCCGGTGA CCGCCGACGC CGCCATTCAT 
CAGCTGTTTC TCACCGAGAT GGACATCTAC GGCTACCAGA GCCAGGCCCA CGTGCGCCCG 
CCGCTGCGTT CCACCGGCGA CCGCGACGCC CTGCGCCGGG CGCTGGCGGC CGGCGAGCTT 
CCGGTCCTCT GCTCCGACCA CCAGCCCCAC GATCCGGACG CCAAGCGTTG CCCCTTCGCC 
GAGAGCGAAC CAGGCATCTC CGGGCTGGAC AGCCTGCTGG CGCTCGTCTT GCGCCTGGCC 
GACGAGCTCA ACCTGCCCCT GACCCGCGCC CTGGCACCGG TCACCAGCGG CCCGGCACGG 
GTCCTGGACC TGCCGGGTGG GCGCCTGACC GAGGGCGCCC CGGCGGACAT CTGCCTGTTC 
GATCCGGACG AGGTCTGGTG GTTCAAGGCC AGCGACATGC ACAGCCGGGG CGAGAACAGC 
CCGTTTACGG GCTGGGAATT CACCGGCCGG GCCCGCTACA CCATCGTCGA CGGACTCCGG 
GTCTATGACG CCCACAACTG A

Protein sequence

MTAWSITGAR VVDPASDRDE VVDLHIADGR IAALGAPPSG WQPEHILQAT GLVACPGLID 
LAARTREPGQ ARKANIASEA RAAAAGGITT LICPPDTRPV TDTPSVVELI RNRSAAAGGA 
RVLPLGALTR NLDGGQLSEM VALSEAGCPG LSDGGRPIAD SLVLRRALEY AATFDLPVHL 
TPEEPILAQG LAHEGQLATR MGLPGIPVAA ETAGLGRMLA LAEEIGARVH FGRLSSRRGL 
ELILAAQRNG QPVTADAAIH QLFLTEMDIY GYQSQAHVRP PLRSTGDRDA LRRALAAGEL 
PVLCSDHQPH DPDAKRCPFA ESEPGISGLD SLLALVLRLA DELNLPLTRA LAPVTSGPAR 
VLDLPGGRLT EGAPADICLF DPDEVWWFKA SDMHSRGENS PFTGWEFTGR ARYTIVDGLR 
VYDAHN