Gene Mnod_1848 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mnod_1848
Symbol
ID	7305878
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium nodulans ORS 2060
Kingdom	Bacteria
Replicon accession	NC_011894
Strand	-
Start bp	1949447
End bp	1950463
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	75%
IMG OID	643599583
Product	transcriptional regulator, AraC family
Protein accession	YP_002497141
Protein GI	220921840
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.172735
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTACCGG CGCAGGCTTT GGCGGAGACG CCAAACATCC CTCGCTTCAT GCCAAACGCA 
CGCCGCATCG AGATCCTGGC CTTTCCCGAT GTCCAGCTGC TCGACGTGGC CGGGCCGCTC 
CAGGTCTTCT CCACCGCCAA CGACATCGCG GCCGCAGGAG GCGCGCCGCT CCCCTATGCC 
CCCACCGTGG TCGCGGCCGA GGCCTCGGTG ACGAGCACGG CCGGCCTCGC GCTCGCCACC 
GAGCCCCTGC CCCCGGCCGA CGCGCCCCTG CACACGCTGA TGGTGGCGGG CGGGCGCGGG 
GTCGATGCGG TGAGCGAGGA TCCGGCGCTG CTCGCCTGGG TCCGGCGCCG AGCCGATGCG 
GCGATCCGCA CGGCCTCCGT CTGCAGCGGT GCCTTCGTGC TCGCCGGGGC GGGGCTCCTC 
GACGGCCGGC GCGCGGTCAC CCATTGGGGT CGCTGCGCCC AGTTCGCCGC GCGCTTTCCC 
GCCGTGCGGC TCGATCCCGA TCCGATCTTC GTCCGGGACG GCAGCGTCTG GACCTCCGCG 
GGGGTCACGG CGGGCATCGA CCTCGCCCTC GCCCTGGTGG AGGACGATCT CGGCCGCGCC 
ACTGCCCTGG CGGTGGCCCG CCAGCTCGTC ATCTTCCTCA AGCGCCCCGG CGGGCAGGCG 
CAGTTCAGCA CGCTCCTCGC CCTCCAGGAG GCGGGACGCT TCGACCGGCT CCATGCCTGG 
ATCGCCGAGA ACCTGAGGGC CGACCTCTCG CTCGCGGCCC TGGCGGACCG GGCCGCCATG 
AGCGCCCGCA GCTTCTCGCG CCATTACCGG CAGGCGACCG GGCGCACGCC CGCGCGGGCG 
GTCGAGGAGA TCCGGGTCGA GGCGGCCCGC CGGCTGCTGG AGCAGGGCGC GCCCGTGGCG 
CGGGCGGCGG CCCAGTGCGG GTTCGGATCG GAGGAGACCA TGCGGCGCGG CTTCCTGCGG 
GTGATCGGCA CCGGGCCGCG GGCCTATCGC GAGCGCTTCT CGGGGCGCTC CGCGTGA

Protein sequence

MLPAQALAET PNIPRFMPNA RRIEILAFPD VQLLDVAGPL QVFSTANDIA AAGGAPLPYA 
PTVVAAEASV TSTAGLALAT EPLPPADAPL HTLMVAGGRG VDAVSEDPAL LAWVRRRADA 
AIRTASVCSG AFVLAGAGLL DGRRAVTHWG RCAQFAARFP AVRLDPDPIF VRDGSVWTSA 
GVTAGIDLAL ALVEDDLGRA TALAVARQLV IFLKRPGGQA QFSTLLALQE AGRFDRLHAW 
IAENLRADLS LAALADRAAM SARSFSRHYR QATGRTPARA VEEIRVEAAR RLLEQGAPVA 
RAAAQCGFGS EETMRRGFLR VIGTGPRAYR ERFSGRSA