Gene Mboo_1994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_1994
Symbol
ID	5410418
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	+
Start bp	2058685
End bp	2060088
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	57%
IMG OID	640869236
Product	O-acetylhomoserine/O-acetylserine sulfhydrylase
Protein accession	YP_001405151
Protein GI	154151533
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGGTG ATATCTTCGG ATTCCTTTCG AGGGCAAATC CGTTCTCAAA GAAAGATGCA 
GACAAGAAAG AACAGAGTAA GGAACAAAAC AAAACCGAGG CGATAGCCAT TACCGAAAAA 
AAACTCAACC TTGGAACGCT TGCCCTGCAC GCGGGGCAGG TTCCGGACCC GGCCACCGGG 
TCACGGACAG TACCGATCTA CCAGACCTCC TCGTATGTGT TCAAGAGCAC GGAACACGCT 
GCCAACCTGT TTGGTCTGCG GGAACTGGGG AATATCTACA CCCGGCTCAT GAACCCGACC 
ACCGATGTGT TCGAGAAGCG CATTGCCGCC ATCGAGGGAG GAACCGGGGC GCTTGCCACG 
GCATCAGGCC AGGCAGCAAT CACCTACGCG CTCCTCAACA TCACCCGGCC CGGGGACGAG 
ATCGTCTCTG CCGATAACCT GTACGGCGGT ACCTATGAAC TGTTCCACTA CACGCTCCCG 
AAGCTCGGGA GGACGGTAGT CTTTGTTGAC TCCACCAAGC CCGAGGCGTT CAGGAATGCA 
ATTACTCCCA AGACCCGTGC CATCTATGCC GAGACCGTGG GTAATCCGAA ACTCGATACC 
CCTGACTTTG AAGCGATTGC AAAGATCGCC CACGACAATG GCATCCCGGT GGTTGTGGAC 
AACACCACCG GTGTCGGCCT TGTCCGCCCG ATTGACCATG GCGTAGACAT TGTCGTTCAT 
TCGGCCACGA AGTACATCGG CGGCCACGGC AACTCCATCG GCGGCGTGAT CGTTGATTCG 
GGCAAGTTCG CCTGGAACAA CGGCAAGTTC CCCGAGTTCA CCGAACCGGA CCCGGGCTAC 
CACGGCCTCA AATACTGGGA TGCGTTCGGG AACTTCCCCG GCCTCGGAAA CGTTGCCTTC 
ATCTTCAAGA TCCGGGTTTC ACTGCTCCGG GATACGGGAG CAGTCTTAAG CCCGTTTAAC 
GCCTGGCTCT TCCTTATCGG CCTTGAGACC CTCCACCTGC GTGTGCCACG CCACTCCGAG 
AATGCCTTTG CCGTTGCAAA GTTCCTCAAA GGTCATCCCA AGGTCGCATG GGTCAACTAC 
CCCGGGCTCC CGGAGCACCC CAGCCACACC TTAACCAAGA AATACCTCCA CGGCGGTTTC 
GGCCCCCTCG TCGGTGTCGG GATCAAGGGT GGGGAGACCG CAAGCAGGAA GTTCATCGAT 
TCCCTCAAGC TCTTCAGTAA CCTCGCTAAT ATCGGCGATT CAAAGAGCCT TGTGATCCAC 
CCGGCAACCA CCACCCACCA GCAGCTTACC GCTGAGGAAC AGGCCAAGAC CGGCGTTACT 
CCGGATGCCG TCCGCCTTTC CGTCGGTACT GAGGATATCG AGGATATCAT CGCTGATCTC 
AGGCAGGCAC TGGACAAGGT ATAA

Protein sequence

MTGDIFGFLS RANPFSKKDA DKKEQSKEQN KTEAIAITEK KLNLGTLALH AGQVPDPATG 
SRTVPIYQTS SYVFKSTEHA ANLFGLRELG NIYTRLMNPT TDVFEKRIAA IEGGTGALAT 
ASGQAAITYA LLNITRPGDE IVSADNLYGG TYELFHYTLP KLGRTVVFVD STKPEAFRNA 
ITPKTRAIYA ETVGNPKLDT PDFEAIAKIA HDNGIPVVVD NTTGVGLVRP IDHGVDIVVH 
SATKYIGGHG NSIGGVIVDS GKFAWNNGKF PEFTEPDPGY HGLKYWDAFG NFPGLGNVAF 
IFKIRVSLLR DTGAVLSPFN AWLFLIGLET LHLRVPRHSE NAFAVAKFLK GHPKVAWVNY 
PGLPEHPSHT LTKKYLHGGF GPLVGVGIKG GETASRKFID SLKLFSNLAN IGDSKSLVIH 
PATTTHQQLT AEEQAKTGVT PDAVRLSVGT EDIEDIIADL RQALDKV