Gene Mchl_3216 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_3216
Symbol
ID	7117555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	+
Start bp	3399286
End bp	3400386
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	70%
IMG OID	643525967
Product	chorismate synthase
Protein accession	YP_002421982
Protein GI	218531166
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.279354
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.10403
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCACA ACACCTTCGG CCACCTGTTC CGCGTCACCA CCTTCGGCGA GAGCCACGGG 
GTGGCGCTCG GCTGCGTGGT GGACGGATGC CCGCCCGGCC TCGCGCTGGA AGCCGAGGAC 
ATCCAGGCGG AGCTCGACCG GCGCAAGCCC GGCCAGTCGC GCTTCACCAC GCAGCGGCGC 
GAGCCGGATC AGGTGAAGAT CCTGTCCGGC GTGTTCAGCG ACGACCGCAC CGGCGGGCGC 
CAGCTCACCA CCGGCACGCC GATCGCGCTG ATGATCGAGA ACACCGATCA GCGCTCGAAA 
GACTATTCCG AGATCCGCGA CAGCTACCGC CCCGGCCACG CCGACTTCAC CTACGATGCC 
AAGTACGGCA TCCGCGACTA TCGCGGCGGC GGACGCTCCT CCGCCCGCGA GACCGCCGCG 
CGGGTCGCGG CCGGCGCGGT GGCGCGCAAG GTCATCCCCG GCATCACCAT CCGCGCTGCC 
CTGGTGCAGA TGGGGCCGCA CGCCATCGAC CGCGCGAACT GGGATTGGGA GCAGGTCGGC 
CAAAATCCGT TCTTCTGCCC CGACGCGAAG GCGGCGGCGC TCTACGAGAC CTATCTCGAC 
GCAATCCGAA AAGACGGCTC CTCGGTCGGC GCGGTGATCG AGGTGGTGGC CGAAGGCGTG 
CCGCCCGGGC TCGGCGCACC GATCTACGGC AAGCTCGACG CGGATCTCGC CGCAGCGATG 
ATGTCGATCA ATGCGGTCAA GGGCGTGGAG ATCGGCGACG GCTTCGCCGC CGCAGCCCTC 
CGCGGCGAGG ACAATGCCGA CGAGATGCGC GCCGGCAATG ACGGCCGCCC GCGCTTCCTC 
GCCAACCATG CCGGCGGCAT CCTGGGCGGC ATTTCGTCGG GCGAGCCGGT GGTTGTCCGG 
TTTGCCGTGA AGCCGACCTC CTCGATCCTG ACCCCGCGCC AGAGCGTGAA CCGCGACGGG 
GCTGAGATCG ACCTCATCAC CAAGGGCCGC CACGACCCCT GCGTCGGCAT CCGCGCCGTC 
CCCGTCGCCG AGGCGATGAT GGCCTGCGTG CTGGCCGATC ACACTCTCCG CCATCGCGGG 
CAGAACGGCG AGCGCCCGTG A

Protein sequence

MSHNTFGHLF RVTTFGESHG VALGCVVDGC PPGLALEAED IQAELDRRKP GQSRFTTQRR 
EPDQVKILSG VFSDDRTGGR QLTTGTPIAL MIENTDQRSK DYSEIRDSYR PGHADFTYDA 
KYGIRDYRGG GRSSARETAA RVAAGAVARK VIPGITIRAA LVQMGPHAID RANWDWEQVG 
QNPFFCPDAK AAALYETYLD AIRKDGSSVG AVIEVVAEGV PPGLGAPIYG KLDADLAAAM 
MSINAVKGVE IGDGFAAAAL RGEDNADEMR AGNDGRPRFL ANHAGGILGG ISSGEPVVVR 
FAVKPTSSIL TPRQSVNRDG AEIDLITKGR HDPCVGIRAV PVAEAMMACV LADHTLRHRG 
QNGERP