Gene Gdia_3134 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_3134
Symbol	metX
ID	6976568
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	3431439
End bp	3432602
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	68%
IMG OID	643392642
Product	homoserine O-acetyltransferase
Protein accession	YP_002277479
Protein GI	209545250
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.289102
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.106399
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCAGA CCCTTCCCAC CCCGCTGGAA CACGACCATC TGCTGTTTCC CGAAGGTTTG 
GCGCTGGAAT GCGGATTCCG CCTGGCGCCG GTGCGGGTCG CCTACCGGAC CTACGGCACC 
CTGTCGGCGG CGCGCGATAA CGCGATCGTC GTCTGCCATG CCCTGACGGG CGACCAGTAC 
CTGGCCGATA CCCAGCCCCT GACCGGCAAG CCCGGCTGGT GGAGCCGCAT GGTGGGGCCC 
GGGTTGCCGA TCGACACCGA CCGGTTCTTC GTCATCTGCA TGAACGTGCT GGGCGGGTGC 
ATGGGCTCGA CCGGGCCGCG GTCCTCGCGC ACCGGAATGG AAGGCGAGGG GGCGGAGCCG 
TGGGGCACCG ATTTTCCGCC GATTACCATC CGCGACATGG TCCGCGCGCA GAAGCTGGTC 
GTCGACCATC TGGGCATCCG GCGGCTGTTC GCCGTCGTCG GCGGGTCGAT GGGCGGGATG 
CAGGTGCTGG AATGGGCCGC GACCTTCCCC GACATGGTGT TCGCGGCGAT GCCGATCGCG 
ACCTCGCCGT TCCATTCGGC CCAGAACATC GCGTTCAACG AGGTCAGCCG CCAGGCCATC 
TTCGCCGATC CCGACTGGCA TGGTGGCCGC TACTGGGAAC GCGAGGCCGT CCCGGCGCGG 
GGGCTGGCGG TCGCGCGGAT GATGGCGCAC ATCACCTATC TGTCCGAAGA GGCGCTGACG 
CGGAAATTCG GCCGGCGGGT GCGGCGCGAC CCGTACGGTC CGGCCAACCC GCTGTCCCTG 
TTCGGCGAGA TGTTCGAGGT CGAGAGCTAT CTGCGGCACC AGGGCTCGTC CTTCGTGCGG 
CGCTTCGACG CCAATTCCTA CCTGACCATC ACGCGGGCCA TGGATTATTT CGACCTGGGA 
GCCGATCATG ACGGCGACCT GTCGCGGCCG TTCCAGGGAA CGCGCACGCG TTTCTGCATC 
GTCTCGTTCT CGTCCGACTG GCTGTTCCCG ACCTCGCAGG CGCGGCTGCT GGCGCGCGCG 
CTGAACCGCG CCGCCGCCAA CGTGTCGTTC GTCGAGATCG AGAGCGACAA GGGCCATGAC 
GCCTTCCTGC TGGACGAGCC GGATTTCGAT CGCACGGTGC GCGGCTTCCT GTCCGGCGCC 
GCCGAACATG CGCGGATCGG CTGA

Protein sequence

MDQTLPTPLE HDHLLFPEGL ALECGFRLAP VRVAYRTYGT LSAARDNAIV VCHALTGDQY 
LADTQPLTGK PGWWSRMVGP GLPIDTDRFF VICMNVLGGC MGSTGPRSSR TGMEGEGAEP 
WGTDFPPITI RDMVRAQKLV VDHLGIRRLF AVVGGSMGGM QVLEWAATFP DMVFAAMPIA 
TSPFHSAQNI AFNEVSRQAI FADPDWHGGR YWEREAVPAR GLAVARMMAH ITYLSEEALT 
RKFGRRVRRD PYGPANPLSL FGEMFEVESY LRHQGSSFVR RFDANSYLTI TRAMDYFDLG 
ADHDGDLSRP FQGTRTRFCI VSFSSDWLFP TSQARLLARA LNRAAANVSF VEIESDKGHD 
AFLLDEPDFD RTVRGFLSGA AEHARIG