Gene Dole_0752 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0752
Symbol	metX
ID	5693587
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	875780
End bp	876955
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	60%
IMG OID	641263349
Product	homoserine O-acetyltransferase
Protein accession	YP_001528639
Protein GI	158520769
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00772131
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGAAT ATATCGAACA CGATAAAAGC GGTGTGTCCG TGGGGCTGGT GGAAAAACAG 
TTTTTCACCT TTGCCGAACC CCCGAACCCG ATGAAACTGG ACAGCGGCGC CGTTCTGGGG 
CCGGTGACCA TCGCCTATGA GACCTATGGC CGACTGAACG AAGACGCAAG TAACGCCGTG 
CTGGTGGCCC ACGCCCTTAC CGGCGATTCC CACGCCGCCG GCTGCTACAG CAAAACCGAC 
CCCAAGCCCG GCTGGTGGGA CATCATGGTC GGCCCGGGCA AGGGGATTGA CACCAATAAA 
TACTTTGTGA TCTGCTCCAA CGTTCTCGGC GGGTGTATGG GCTCCACCGG GCCGTCATCG 
GTGAACCCGA CCACAAAAAA ACCCTACGGC GCAAGCTTTC CGGTGATCAC CATCGGTGAC 
ATGGTCCGGG CACAGAAGGC CCTGACAGAC CACCTGGGCG TCAAACGGCT CCTGGCCGTG 
GTAGGCGGCT CCATGGGCGG CATGCAGGTA ATGGAGTGGT GCGTCCGCTA CCCGGAGATG 
GTAACGTCGG CCATTCCCCT GGCCACCACC ACCCGCCATT CGGCCCTGGC CATTGCCTTT 
AACGAGGTGG CCCGGCAGGC CATCATGACC GACCCCAACT GGAGCAGCGG TGATTACTAC 
GGTGGCAACA AGCCGGCCAT GGGCCTGGCC GTGGCCCGCA TGATCGGCCA CATCACCTAT 
CTTTCGGATG AGGCCATGCG CCAGAAGTTC GGCCGCCGGC TGCAGGACAA GGCAGCGGTC 
TCTTTTGATT TCGGCGCCGA CTTCCAGGTG GAGAGCTACC TGCGCCACCA GGGCGCCAAG 
TTTGTGGAGC GGTTTGACGC CAACACCTTT CTTTACATCA CCAAGGCCGC CGACTACTTT 
GACCTGGAGG CCCAGCACGG GAACGGATCA GCGGTGGAGG CCTTTTCAAA GGCCCGTGCC 
CGGTTCCTGG TGGTCTCCTT TACATCGGAC TGGCTTTACC CCACCTACCA GTCCCGCGCC 
ATGGTCACGG CCATGAAGAA AAACGCCCTG GATGTCAGCT TCTGCGAAAT CGAAGCCGAC 
TGCGGCCATG ACGCGTTTCT GATTCCCAAC CCGCGCCTGA GCGCCCTGAT TAAAGGATTT 
TTAGAAAGTG TATCCACCGG ACAACAGCAC CCATAA

Protein sequence

MSEYIEHDKS GVSVGLVEKQ FFTFAEPPNP MKLDSGAVLG PVTIAYETYG RLNEDASNAV 
LVAHALTGDS HAAGCYSKTD PKPGWWDIMV GPGKGIDTNK YFVICSNVLG GCMGSTGPSS 
VNPTTKKPYG ASFPVITIGD MVRAQKALTD HLGVKRLLAV VGGSMGGMQV MEWCVRYPEM 
VTSAIPLATT TRHSALAIAF NEVARQAIMT DPNWSSGDYY GGNKPAMGLA VARMIGHITY 
LSDEAMRQKF GRRLQDKAAV SFDFGADFQV ESYLRHQGAK FVERFDANTF LYITKAADYF 
DLEAQHGNGS AVEAFSKARA RFLVVSFTSD WLYPTYQSRA MVTAMKKNAL DVSFCEIEAD 
CGHDAFLIPN PRLSALIKGF LESVSTGQQH P