Gene Mboo_1564 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_1564
Symbol
ID	5410089
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	+
Start bp	1632306
End bp	1633292
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	63%
IMG OID	640868798
Product	chorismate synthase
Protein accession	YP_001404724
Protein GI	154151106
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACACCT TTGGAAGCAA TTTCCGCATA ACAACCTTTG GCGAGAGCCA CGGCCCGGCC 
GTGGGCTGCG TTATTGACGG GTGCCCGCCC CGGCTCGCAC TTTCCGCGGA TGACATCCAG 
CCGCTGCTGG ACCGGCGCCG CCCGGGCACA TCCCCCCTCT CCTCGGCACG GGACGAGGCA 
GACACCGTTG AGATCCTCTC GGGCGTATTT GAGAAGATGA CCACGGGGAC CCCGATTGCG 
CTCCTTGTGC GGAACCAGGA TATGCACTCG CGCGATTACG ATACGATAAA AGAGAAGTTC 
CGCCCGGGCC ATGCGGATTT CACGTACCAG GCCAAGTACG GTATCCGGGA CTACCGCGGC 
GGGGGCAGGA GCTCGGGGCG CGAGACCGTG GGCCGGGTTG CGGCAGGAGC GGTGGCCCTG 
AAGTACCTGG CCACAAAAGG GATCGCGGTC CAGGGCCGGA TCGTGGCCGT GCACGGCAAA 
ACCGATCCGC AGAATATCGA AAACGAGATC CTCGGGGCAA AGTCTGCCGG TGATTCTGTG 
GGCGGGATCG CGGAGATCAC GGCCACCGGC TGCTCAGCGG GCCTGGGTGA TCCCGTATTC 
GGGAAACTTG ACGCAGGCAT TGCAGCGGCC ATGATGGGGA TAGGCGCGGT CAAGGGTGTT 
GAGATTGGCG ACGGCTTTGC CGTGGCAGAA CGCTTCGGTA GCGAGAACAA CGACCCGATG 
ACCGCAGCCG GATTTCAAAG CAACCATGCC GGGGGGATCC TTGGGGGGAT CTCCACAGGA 
CAGGACCTCG TGGTGCGCAT CGCGGTAAAA CCCACGCCGT CCATTGCAAA AGTCCAGCAT 
ACCCGGGACA TCCACGGGAA CGCAACAACG ATTACGATTG GCGGCCGGCA CGACCCCTGC 
ATCGTGCCCC GGATCCTCCC GGTGGCAGAG GCAATGCTCG CCCTCGTTCT CATCGACGCG 
GTGCTGGAGC AGGAAAAATA CCGGTAA

Protein sequence

MNTFGSNFRI TTFGESHGPA VGCVIDGCPP RLALSADDIQ PLLDRRRPGT SPLSSARDEA 
DTVEILSGVF EKMTTGTPIA LLVRNQDMHS RDYDTIKEKF RPGHADFTYQ AKYGIRDYRG 
GGRSSGRETV GRVAAGAVAL KYLATKGIAV QGRIVAVHGK TDPQNIENEI LGAKSAGDSV 
GGIAEITATG CSAGLGDPVF GKLDAGIAAA MMGIGAVKGV EIGDGFAVAE RFGSENNDPM 
TAAGFQSNHA GGILGGISTG QDLVVRIAVK PTPSIAKVQH TRDIHGNATT ITIGGRHDPC 
IVPRILPVAE AMLALVLIDA VLEQEKYR