Gene Mboo_2137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_2137
Symbol
ID	5409955
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	-
Start bp	2209058
End bp	2210113
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	58%
IMG OID	640869382
Product	histidinol-phosphate aminotransferase
Protein accession	YP_001405294
Protein GI	154151676
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGCGCT TGGTAAGGTC GTGCTATAAG CAGGGCGGAT ATGTTTTCGC AAAGAAGGCG 
GGAGGCCGTA CACACGGTGC GGGCGACGAG CGTATCGCCC GCCTTGCCAG CAACGAGAAT 
CCCGAGGGTC CGTCGCCGGC AGCGGTAATG GCTGCACAGG AAGCGGTCCT TACCGCAAAC 
CGGTACCCCG ATGAGCGGGT GGACGTACTC GTGTCTGCAT TAAAGACGCA CTACGGGGAC 
TACGCCTTTG TAGCCGGCGT TGGCATGGAC GGGGTAATCG AGACCCTGAT GCGGACGCTT 
GTCGAGCCGG GAGAGACGGT GGCGGTTTCG ACCCCGACGT TTTCCTTCTA TGGGCTTGCC 
GCACAGGCAC AGGGAGCAAA GGTTGTTTCT GTCCCGCGCC GGGCGGACTT TTCTGTCGAC 
ATCGATGCAC TTATTGCGGC CGGGAAGGAC GCGAAGATTA TCGTACTCTG CTCGCCGAAT 
AACCCGACGG GGAACGCAAC CCGTGTTGAA GATGTGAAAA GAGTGCTCGA AGGGATCAAC 
GGATTCCTCT TTCTGGACAA TGCGTACGTC GAGTTCTCCG GGATTGATTA TCTGCCCCTG 
ATCAGGAAGT ACGAGAACCT GGTGATTGGC CGGACGTTCT CGAAGGTGTA CTCGCTTGCC 
GGTCTCCGGA TTGGGTATGC GTTCGTCCCG GCCTGGCTCC AACCCTACTA TGCCCGGGCA 
GGGACGCCCT TTACCGTAAA CTCGGTTTCG GCAGCAGCAG CGGCTGCTGC CCTTTCGGAT 
GACGGGCATG CGGACCGGTA TATCGGGCAT GTCCGTGTGT GGCGGAAGCG GTATGCAGAT 
AAGATAAAAT TCCCCGTCCT CCCCTCTGAT GCAAACTTTG TGATGATTAA TGTGACACCC 
CACACGGGCG ATGAGATCGT AGAGAATCTT GCCGCCAAGG GCGTACTCGT GCGCTCGTGC 
AGAAGTTTTA CAGGGCTCGG CGATCATTAT ATCCGGGTGA GCGTCGGAGA GGACTGGGAG 
AACGAGCGGT GCATACAGGA GCTCAACGCC CTATGA

Protein sequence

MERLVRSCYK QGGYVFAKKA GGRTHGAGDE RIARLASNEN PEGPSPAAVM AAQEAVLTAN 
RYPDERVDVL VSALKTHYGD YAFVAGVGMD GVIETLMRTL VEPGETVAVS TPTFSFYGLA 
AQAQGAKVVS VPRRADFSVD IDALIAAGKD AKIIVLCSPN NPTGNATRVE DVKRVLEGIN 
GFLFLDNAYV EFSGIDYLPL IRKYENLVIG RTFSKVYSLA GLRIGYAFVP AWLQPYYARA 
GTPFTVNSVS AAAAAAALSD DGHADRYIGH VRVWRKRYAD KIKFPVLPSD ANFVMINVTP 
HTGDEIVENL AAKGVLVRSC RSFTGLGDHY IRVSVGEDWE NERCIQELNA L