Gene Mboo_2043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_2043
Symbol
ID	5411170
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	-
Start bp	2119131
End bp	2120606
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	59%
IMG OID	640869285
Product	homoserine O-acetyltransferase
Protein accession	YP_001405200
Protein GI	154151582
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG2021] Homoserine acetyltransferase [COG2524] Predicted transcriptional regulator, contains C-terminal CBS domains
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.633415
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTCGTG GCTCGCTAGG CATCGTTACG ACCCAGTACG CAGACCTCCC CGGTCCCTTT 
ACCCTGGAGA GCGGGGCGGT GCTGCCCGAA ATAAGGATTG CCTACGAGAC CTACGGCAGG 
CTCAACAAGG AAAAGAGCAA CGCGATCCTT CTCTGCCATG CCCTCTCGGG CGACGCTCAC 
GTAGCCGGGT TCCATAACGG GGAAACAAAA CCCGGCTGGT GGGACGCAGT GGTAGGGCCG 
GGAAAGGCGT TTGATACCGA GCGTTACTTT GTTATCTGCA GTAACGTGCT TGGGGGGTGT 
AAGGGCTCGA CCGGCCCTTC CACCATCAAC CCCGAAACGG GCAAACCCTA TGGCGCAACC 
TTCCCGGTGG TGACCATCCG GGACATGGTT AACGCCCAGA AACTTCTTCT TGACAGCCTT 
GGTATTCCCG AACTCTATGC GGTTGCAGGC GGCTCGATGG GGGGGATGCA GGCGCTCCAG 
TGGACTGTCT CCTACCCGGA TCTTATAAAA AAGGCGGTCA TCATCGCCAC GACCGGCTAC 
TCCACCCCCC AGCAGATCGC CTTTAACGAG GTGGGCCGGA AGGCGATTCT CTCCGATCCC 
GACTGGAGTG GCGGGGACTA TTACGGGAAA AAGACCCCTG CCCATGGCCT CGCCCTTGCC 
CGGATGGTGG GCCACATCAC CTACCTCTCC GATGAATCGA TGCACGCGAA GTTCGGGCGC 
TCGCTCCAGG GAAAGGCGCA GGTGGGCTTT GATTTCTCCA CCGAGTTTGC CATCGAGAGC 
TACCTCCACC ACCAGGGTGA TACGTTCACA AAAAGGTTCG ATGCAAACTC GTATCTCTAC 
ATCACCAAGG CCATCGATTA CTTTGATCTC ACCAAAGACG GGTCCCTGAC CACCGGCCTT 
GCAGCGGCAA AGGCTGCGTT CTTTGTTATC TCCGTTACCT CGGACTGGCT GTACCCTCCT 
TACCAGTCGC AGGAGATTGT TACCGCCCTT ACCACGAACG AGCGCGAGGT ACAGTACTGC 
GAGATCCGGT CCAACTACGG CCATGATGCG TTCCTCCTTG AATCCGGGCA GCTCAACTAC 
CTGATCTCCC GGTTCCTCTC CCATACTGTC GTAGGTGACG TGATGGCGAG GAACGTGGAG 
TGCATCGAGG AAGGTACCAC GATCGCGGTT ACCGCCCGGC GGATGATCAC CAGTGGTGTC 
AATCACCTGC CGGTTCTCTC CCCTGCCGGC CAGCTCGTGG GAATCGTGAC CTCGTGGGAC 
ATTGCAAAGG CGGTGGCTTC CAATTTCCTG TGGCTTGACG AGATTATGAG CCGGAACGTG 
GTCACGACCA CCGAGAACGA GCCCGTTGAC GAGGCGGCGC GCAAGATGGA GGCCCACTCG 
ATCTCCGCGC TTCCGGTGAT CGATGGCGAC TCGCACGTGA TCGGTCTTAT TACAAGCGAT 
GCGATCAGTA CCCTTGTAGG GAGACAGAAC CCGTGA

Protein sequence

MLRGSLGIVT TQYADLPGPF TLESGAVLPE IRIAYETYGR LNKEKSNAIL LCHALSGDAH 
VAGFHNGETK PGWWDAVVGP GKAFDTERYF VICSNVLGGC KGSTGPSTIN PETGKPYGAT 
FPVVTIRDMV NAQKLLLDSL GIPELYAVAG GSMGGMQALQ WTVSYPDLIK KAVIIATTGY 
STPQQIAFNE VGRKAILSDP DWSGGDYYGK KTPAHGLALA RMVGHITYLS DESMHAKFGR 
SLQGKAQVGF DFSTEFAIES YLHHQGDTFT KRFDANSYLY ITKAIDYFDL TKDGSLTTGL 
AAAKAAFFVI SVTSDWLYPP YQSQEIVTAL TTNEREVQYC EIRSNYGHDA FLLESGQLNY 
LISRFLSHTV VGDVMARNVE CIEEGTTIAV TARRMITSGV NHLPVLSPAG QLVGIVTSWD 
IAKAVASNFL WLDEIMSRNV VTTTENEPVD EAARKMEAHS ISALPVIDGD SHVIGLITSD 
AISTLVGRQN P