Gene Mlg_1463 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1463
Symbol
ID	4270244
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1669378
End bp	1670400
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	68%
IMG OID	638126219
Product	dihydroorotate oxidase
Protein accession	YP_742302
Protein GI	114320619
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.0318461
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTATTCAC TGATTCGACC GCTGTTGATG CGCATGGATG CCGAGCGCAG CCATGAGTTT 
TCCCTGGCCT GGATGGACCG GCTGGCCCGG CTGGGGTTGG GGCGTCTGCT GTGCGGCCAC 
CGCCTGCCGG ACATGCCGCG CCGGGTCATG GGCCTGACGT TCGCCAATCC GGTGGGTCTG 
GCCGCGGGGC TGGACAAAAA CGGTGAGCAC CTGGAGGCCC TGGGGCACGT GGGCTTTGGG 
TTTATTGAGG TGGGCACGGT GACCCCCAGG CCGCAGCCCG GCAACCCGGA GCCCCGGCTC 
TTTCGCCTGC CCGCCCACGA GGCCATCATC AACCGCATGG GCTTCAACAA CCAGGGCGTG 
GACGCCCTGG TCCAGCGCCT GCGGGTGACC CGCTACCAGG GGGTCTTGGG CGTCAATATC 
GGTAAGAACA AGGACACGCC CACCGAACGG GCCACCGACG ACTACCTGAG CTGTTTACAG 
AAGGTCTACC CCTACGCCGA TTACGTGGCG GTGAACGTCT CCTCGCCAAA CACCCCCGGG 
CTGCGCGACC TGCAGGGGGG CGAGTTGCTG GAAGCGTTGC TGGGCCGACT CACTCACCTG 
CGGGGTGTGC TGGCCCGGGA GTACGGCCGT TACGTGCCCC TGGTGGTCAA GATCGCGCCG 
GATATGGATG AGGCCCAGCG GGCCCACTTC TGCCAACAGG TGCTGCGTTA CGGCATCGAC 
GGCGTCGCGG CCACCAATAC CACCCTGTCC CGCGACGGGG TGGAGGATGA CCCGCTGGCC 
CGGGAGCAGG GCGGGCTCTC CGGCGCCCCC TTGCGGCCGC GCGCCCAGGC GGTGCTCGAG 
GAGCTGGGAC AGCGGCTCGG TCACCGGGTG CCATTGATCG GTGTCGGCGG CATCATGAGC 
GGTGCCGATG CCCAGGCCCG CATGGCGGCA GGCGCCGACC TGCTTCAGAT CTACTCGGGG 
TTCATCTACC GCGGGCCGCT CCTGCTGGAG GAGCTGCTCA AGGCGGTGGC GCCCGAGCAC 
TGA

Protein sequence

MYSLIRPLLM RMDAERSHEF SLAWMDRLAR LGLGRLLCGH RLPDMPRRVM GLTFANPVGL 
AAGLDKNGEH LEALGHVGFG FIEVGTVTPR PQPGNPEPRL FRLPAHEAII NRMGFNNQGV 
DALVQRLRVT RYQGVLGVNI GKNKDTPTER ATDDYLSCLQ KVYPYADYVA VNVSSPNTPG 
LRDLQGGELL EALLGRLTHL RGVLAREYGR YVPLVVKIAP DMDEAQRAHF CQQVLRYGID 
GVAATNTTLS RDGVEDDPLA REQGGLSGAP LRPRAQAVLE ELGQRLGHRV PLIGVGGIMS 
GADAQARMAA GADLLQIYSG FIYRGPLLLE ELLKAVAPEH