Gene Mlg_0375 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0375
Symbol
ID	4269000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	420126
End bp	421235
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	77%
IMG OID	638125106
Product	diaminohydroxyphosphoribosylaminopyrimidine deaminase / 5-amino-6-(5-phosphoribosylamino)uracil reductase
Protein accession	YP_741220
Protein GI	114319537
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0117] Pyrimidine deaminase [COG1985] Pyrimidine reductase, riboflavin biosynthesis
TIGRFAM ID	[TIGR00227] riboflavin-specific deaminase C-terminal domain [TIGR00326] riboflavin biosynthesis protein RibD

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.989809
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.14287
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGGTT TCTCCCCCGC CGACAACCTC TTCATGGGCC GGGCCCTGCG CCTGGCCCGC 
CGCCCGCAGC AGCCGCCCCA TCCCAACCCC GCCGTCGGCT GCGTGCTGGT GCGCGACGGG 
CTTATCGTCG GCGAGGGCTG GCATGAGCGG GCGGGCGAGC CCCACGCGGA GGCCATGGCC 
CTGCACCGGG CCGGCGAGCA GGCCAGCGGC GCCACCGCCT ACGTCACCCT GGAGCCGTGC 
AGCCACCACG GCCGCACCCC GCCCTGCAGC GAGGCCCTGC TGGCGGCCGG CGTGGTCCGG 
GTGGTGGCGG CCATGACCGA CCCCAACCCG CAGGTGGCCG GCCGCGGGCT GCGCCGCTTG 
CGCGCCGCCG GGCTGGAGGT GGCCACCGGC TTGATGGCCG AGCAGGCGGC GGCGCTGAAC 
CCCGGCTTCA CCCAGCGGAT GCGCACCGGG CGGCCCTGGC TGCGGCTGAA ATCGGCGGCC 
AGTCTCGACG GGCGGACCGC CATGGCCTCC GGCGAGAGCC GCTGGATCAC CTCGCCCCAG 
GCCCGGGCCG ACGTCCACCG CTGGCGGGCG CGCAGCGACG CCATGCTCAC CGGCATCGGC 
ACCGTGCTGG CGGACGACCC GCGCCTGGAT GTCCGCGATG CCGGCATCGA GGCGCCGCGC 
CAGCCGCGCC GCTGCGTGCT CGACCGCGAC CTGCGGACCC CCGCGGACGC GGTCCTGCTC 
CGCGGCGAGG GCGCGACCCT GTTCCACGGC CCGGACGTGG CCGCCGGACA GATCCGGCGG 
CTGACCGACG CCGGCGCCCA CTGCGTGGCG CTGCCGCTGG CGGACGGGCG CCTGGACCTG 
GGCGCGGCCC TGGACTGGCT GGGCGGTCAG GGGTGCAATG AGGTGCTGGT GGAGGCCGGG 
CCGACCCTGG GCGGGGCCTT GAGCCGCGCC GGTCTGGTGG ATGAATGGCT GCTCTACCTG 
GCGCCCCACC TGATGGGCGA CGCGGCGCGG CCGCTGCTGC ACTGGCCGGG GCTGGAGACG 
ATGAGCCAGC GCCAGCCCCT CCGGGTGCAG GACTGCCGCT TGGTGGGGCC GGATCTGCGG 
TTGACGCTGC GGCTGGGGAG CGGGACCTGA

Protein sequence

MSGFSPADNL FMGRALRLAR RPQQPPHPNP AVGCVLVRDG LIVGEGWHER AGEPHAEAMA 
LHRAGEQASG ATAYVTLEPC SHHGRTPPCS EALLAAGVVR VVAAMTDPNP QVAGRGLRRL 
RAAGLEVATG LMAEQAAALN PGFTQRMRTG RPWLRLKSAA SLDGRTAMAS GESRWITSPQ 
ARADVHRWRA RSDAMLTGIG TVLADDPRLD VRDAGIEAPR QPRRCVLDRD LRTPADAVLL 
RGEGATLFHG PDVAAGQIRR LTDAGAHCVA LPLADGRLDL GAALDWLGGQ GCNEVLVEAG 
PTLGGALSRA GLVDEWLLYL APHLMGDAAR PLLHWPGLET MSQRQPLRVQ DCRLVGPDLR 
LTLRLGSGT