Gene Mbur_1012 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbur_1012
Symbol
ID	3998117
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanococcoides burtonii DSM 6242
Kingdom	Archaea
Replicon accession	NC_007955
Strand	+
Start bp	1093889
End bp	1094989
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	47%
IMG OID	637958792
Product	chorismate synthase
Protein accession	YP_565701
Protein GI	91773009
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	57
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCGGAA ATACCTTTGG CCATTCTTTC AGGATAACAA CCTGGGGAGA ATCACACGGA 
CGTGCATTGG GAGTCGTTAT TGACGGGGTA CCCGCAGGAC TTCCCCTTGA CACAGAGATA 
GTACAGAAAG AGCTTGACAG ACGACGTCCC GGCCAAAGCG CTGTATCCAC ACCGCGTTCA 
GAGACAGACA AGGTGGAGAT CATTTCAGGG ATATTTGAAG GAAAAACTAC CGGCACACCC 
ATTTCCATGA TGGTATGGAA CAAGGATGCT GATTCGAGTT CTTACGACAA TATCAAAGAC 
CTCCCCAGAC CGGGGCATGC CGATTACCCA TACATGGAAA AATATGGCAT CCGTGACCAT 
CGGGGAGGAG GACGTTCTTC CGCACGTGAG ACCATTGGAA GAGTTGCAGC AGGAGCTGTT 
GCAAAAGAGA TACTTTCAAT TTTTGGTATT GATATCATTG CACATGTCAC AGAACTTGGC 
GGTATTCGTG CAAAAGAGAT GCCTTTTGAT ACAATAAAGG AACATCTTGA AAAGACACCT 
GTCAGATGTG CCGATCTGGA AGCGGCACAA TTGATGCTCG AAAAGGTTGG CAAAGCACGG 
GAAGAACATG AAAGCATTGG TGGTGTTGTC GAAATAATAG CTATCGGCCT GCCACCGGGA 
ATAGGAGAGC CAGTTTTCGA TAAACTTGAT GCAGATATAG CAAAAGCTAT CATGAGCATC 
GGTGCTGTCA AAGGTGTTGA GATAGGGATT GGAAATGAGG CAGCACAGAT GAAGGGAAGC 
CAGATGAACG ATCCTTTCAT ACTGGAAGAC GGGAAGATAA TCGCACAGAC CAATAATGCA 
GGCGGGATAC TCGGAGGACT TTCCACAGGA ATGCCCATAA TCTGCCGTGC AAGTGTCAAA 
CCCACACCAT CCATATCAAA AGTGCAGCAC ACTGTCAATA CAAAAGAGAT GAAGAACAGC 
GATATAATCA TCAAAGGCCG CCATGACCCA ACCATCCCGC CACGAATGGT TCCCGTTGCA 
GAAGCCATGA TGGCATTGGT ACTTGTCGAC CACATGATAA GAAGCGGTCA TATTCATCCG 
AACTCACTTT TGAAACAATG A

Protein sequence

MPGNTFGHSF RITTWGESHG RALGVVIDGV PAGLPLDTEI VQKELDRRRP GQSAVSTPRS 
ETDKVEIISG IFEGKTTGTP ISMMVWNKDA DSSSYDNIKD LPRPGHADYP YMEKYGIRDH 
RGGGRSSARE TIGRVAAGAV AKEILSIFGI DIIAHVTELG GIRAKEMPFD TIKEHLEKTP 
VRCADLEAAQ LMLEKVGKAR EEHESIGGVV EIIAIGLPPG IGEPVFDKLD ADIAKAIMSI 
GAVKGVEIGI GNEAAQMKGS QMNDPFILED GKIIAQTNNA GGILGGLSTG MPIICRASVK 
PTPSISKVQH TVNTKEMKNS DIIIKGRHDP TIPPRMVPVA EAMMALVLVD HMIRSGHIHP 
NSLLKQ