Gene Mchl_4110 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_4110
Symbol
ID	7114417
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	+
Start bp	4333052
End bp	4334149
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	68%
IMG OID	643526827
Product	transcriptional regulator, AraC family
Protein accession	YP_002422835
Protein GI	218532019
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCTCGT CTATTGGATC ATACGCCAAC GGCGGCCCGG ACGGGGTGGC GGCGGACGAG 
AGTTCCGAGG AGGCTGAGCA AGCTCCGTCC GTCGGCTTCA TCCATTCTGA TGTCGTGCGG 
GCGAGCCACA CCGTCCTGGT GGAACTCGGC GCCGACCTTG ATGGCCTCAT CGCCGCGGCG 
GGCCTTGATC GCCGCCTGTT CGACGCCAGC AGCAAGCCCG TTCCGTTCAC GGCGATCGGA 
CGCCTGATCG CCCTGGCCGC CGACCACTCG CGCTGCCCTC ATCTCGGGCT ACTGGTTGGG 
AAGCAAACCA CCCTGGCCTC GCTCGGCCTT CTCGGCGTGC TGCTGCGCAA TTGCGCCTCG 
GTGGGTAAAG CTCTGCAGGC CCTGGAAGCG CATGCGCGCG TGCGAGACCG CGGCGCGGTG 
GTCGGCCTCG GCGTCTACAA CGACATCGTC GTCCTCAGCT ATGCCCCGCA CGAGCCCGAG 
GCCGAGGGCG CTGCTCTGCA CTTGGAGAGG GCGCTCGCCA CGCTGACCAA CATCCTGCGG 
GGGTTATATG GGCCTGACTG GGCGCCGCTA GGGGTGCTGC TGCCGCGCTC TGCACCGCGC 
GATACCGTCC CCTACACCGA GTTCTTCGGG GCTCCTGTCC GCTTCGATCA AGAAGCGGCC 
GCCTTGGTGT TCCCGGCCGC GCTCCTGCAG CAGCCGATCG TGGGGGCGGA TCCGGCGCTT 
CGCCAGAGGG CAGAGGACCA CATCCGCCGG CTCGAGGCCG ATCAGCCTTC CACGCTGACG 
GACAAGCTTC GCGAGTATCT CCAGACCGCC GTGACCCAGC AGCGCTGCAG GGTAGAGCGC 
GTAGCGCGCT TGCGACTAGT GAACCGCCGC ACCTTGAGCC GGCACCTGCA GGCGGAGGGC 
ACGAGCTTCC GGCGCCTTGC CAACGAGGCG CAGTTCCGGG TGGCGAAGCA GCTTCTCATC 
GATACCAGCC TGGCGTTGGG GCAGATTTCG GCTGCCCTCG ACTTCTCCGA GCCCGCCGCC 
TTCACGCATG CCTTTCGCCG CTGGTCGGGC GTGACGCCTA GCGCATGGCG GCAGGCGAAC 
CGACCCGAAC AGCAATGA

Protein sequence

MLSSIGSYAN GGPDGVAADE SSEEAEQAPS VGFIHSDVVR ASHTVLVELG ADLDGLIAAA 
GLDRRLFDAS SKPVPFTAIG RLIALAADHS RCPHLGLLVG KQTTLASLGL LGVLLRNCAS 
VGKALQALEA HARVRDRGAV VGLGVYNDIV VLSYAPHEPE AEGAALHLER ALATLTNILR 
GLYGPDWAPL GVLLPRSAPR DTVPYTEFFG APVRFDQEAA ALVFPAALLQ QPIVGADPAL 
RQRAEDHIRR LEADQPSTLT DKLREYLQTA VTQQRCRVER VARLRLVNRR TLSRHLQAEG 
TSFRRLANEA QFRVAKQLLI DTSLALGQIS AALDFSEPAA FTHAFRRWSG VTPSAWRQAN 
RPEQQ