Gene Mchl_1937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_1937
Symbol
ID	7116752
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	+
Start bp	2005382
End bp	2006377
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	73%
IMG OID	643524701
Product	transcriptional regulator, AraC family
Protein accession	YP_002420728
Protein GI	218529912
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGACG ATACCTCCGA ACCAAGCCAC CACGCCCGGC CCCGGCGAAA GCCCGCGCGG 
GCCGAAGATC CCGCTCCGCG AACGGTCGGC TTCGTGCTGG TGCCGGACTT TCCGCTGATG 
GCCTACACCG CGGCGGTCGA GCCCCTGCGC GCCGCCAACA CCCTGTCGGG CTGCGAACTC 
TATCGCTGGT GGCACGCCGC GCCGGGCGGC GGCGTGGTGC AGGCCTCGAA CGGGCTCGGC 
ATCCTCACCG ATGTCGCCGT CGGCGCGCGT GCCAGCGCCG ACCGCGTCTT CGTCTGCGCC 
GGCGGAAACC CGGCCGAGTT CGACGATCCC TCCCTGTTCG CGTGGCTGCG CGGGCTCGCC 
CGCCACGGGG CGACGCTCGG CGGCATTTCC GGCGGGCCGT ATCTCCTCGC CCGCGCCGGT 
CTGCTCTCCG GGCGCCGTTG CACGCTGCAC TGGGAGCACG TCCCGGCCTT CGAGGAGCGC 
TACCCCGAGA TCGAGGTGGT CCGCTCGCTG TTCGAGATCC AGGGCGACCG CATCACCTGC 
TCGGGTGGCA TCGCCGCGCT CGACCTGATG CTCGACCTGA TCGGCCGCGA CCACGGCGCC 
GGCCTCGCCG CGGGCGTCAG CGACTGGTTC CTGCACAACC AGATCCGTGA GGGGTTGAGC 
CCGCAACGGA TGGATCTGCG CCAGCGCTTC GGCGTGCGCG ACCCCCGGCT GCTGCGGGTG 
CTCGCGGCAA TGGAGGCGAA TCTCGAAGCG CCGGTCCCGC GCGTGGCCCT GGCCGATCTC 
GCCCGCGTCT CGGTGCGGCA GTTGGAGCGG CTGTTTCGCG AGGGGCTCGG GCGCGGCCTC 
CACCGGCATT ACCTGCATCT GCGCCTCGAC CGGGCGCACC AGCTCGGCCG CGAGAGCGCC 
TTGAGCCGCG CCGAGATCGC GGCCGCGACC GGCTTTGCCA ACGCCGACGA ACTCGCGCGC 
GCCGAGCGGC GGCGGCACCG GCAGGCAGAG GCCTGA

Protein sequence

MSDDTSEPSH HARPRRKPAR AEDPAPRTVG FVLVPDFPLM AYTAAVEPLR AANTLSGCEL 
YRWWHAAPGG GVVQASNGLG ILTDVAVGAR ASADRVFVCA GGNPAEFDDP SLFAWLRGLA 
RHGATLGGIS GGPYLLARAG LLSGRRCTLH WEHVPAFEER YPEIEVVRSL FEIQGDRITC 
SGGIAALDLM LDLIGRDHGA GLAAGVSDWF LHNQIREGLS PQRMDLRQRF GVRDPRLLRV 
LAAMEANLEA PVPRVALADL ARVSVRQLER LFREGLGRGL HRHYLHLRLD RAHQLGRESA 
LSRAEIAAAT GFANADELAR AERRRHRQAE A