Gene Sala_2886 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2886
Symbol	metX
ID	4080679
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	3037204
End bp	3038325
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	67%
IMG OID	638011270
Product	homoserine O-acetyltransferase
Protein accession	YP_617924
Protein GI	103488363
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAGCC GGTTGCACGA AATCCAGCAT CAAAGCGTGA CGATTCAGGC GCCGCTGCCG 
CTCGACAGCG GACAAAGCCT GCCTTCGGTG ACGATCGCCT GGCAAAGCTA TGGCGCGCTC 
AACGCCGACA AGTCGAACGC CGTGCTCATC TGCCACGCGC TCACCGGCGA CCAATATGTC 
GCGAGCGACC ATCCCGCGAC GGGCAAGCCC GGCTGGTGGG CGCGCATGGT CGGTCCCGGC 
AAGCCGATCG ACACCGACCG TTTCCACGTC ATTTGCGCCA ATGTGCTCGG CAGCTGCATG 
GGGTCGAGCG GGCCGGCGAG CCCCGACGCG GCCACCGGCG CGCCGCTCGG CATGGCCTTT 
CCCGTCATCA CCATCGGTGA CATGGTGCGC GCGCAGGCGA TGCTGCTCGA TCATCTCGGT 
ATCGCGCGGC TGCACGCGGT GGTCGGCGGA TCGATGGGCG GGATGCAGGC GCTCGCCTGG 
GCCGCGGCCT TTCCCGATCG GCTCGGCTCG GCGATCGTCA TCGCCAGCGC GGCACGCCAT 
TCGGCACAGA ATATCGCGTT TCACGAGGTC GGGCGCCAGG CGATCATGGC CGACCCCGAC 
TGGCAGGACG GCCAATATTA TGGCAGCGCG CGCGCGCCGA CCAAGGGGCT CGCGGTCGCG 
CGGATGGCGG CGCACATCAC CTATTTGTCC GAAGCCGGGC TGACCGAAAA GTTCGGCCGC 
CGCCTGCAGG CGCGCGCGAT CAAGAGCTTT GGTTTCGATG CCGATTTTCA GGTCGAATCC 
TATTTGCGGC ATCAGGGGCT GGCCTTCACC GACCGCTTCG ACGCCAACGC CTATCTCTAT 
ATCACGCGCG CGATGGACTA TTTCGACCTT GCCGAACCGC ACGATGGTCG CCTTGCGGGC 
GCCTTTGCGG GGGCGAAGGA TGTGCGCTTC ACGCTCGTCA GCTTCGACAC CGACTGGCTT 
TACCCCACCG CCGAATCGCG CCGCATCGTC CAGGCGCTGC AAAGCGTCGG CGCGGCGGCA 
AGCTTCGTCG AGCTGTCGGC GCCCTTCGGG CACGACAGCT TCCTCCTCGA TGTCCCCGCG 
CTCGACCGGA TCGTCGCGGG CGCGCTCGGG GGCGGACGCT GA

Protein sequence

MASRLHEIQH QSVTIQAPLP LDSGQSLPSV TIAWQSYGAL NADKSNAVLI CHALTGDQYV 
ASDHPATGKP GWWARMVGPG KPIDTDRFHV ICANVLGSCM GSSGPASPDA ATGAPLGMAF 
PVITIGDMVR AQAMLLDHLG IARLHAVVGG SMGGMQALAW AAAFPDRLGS AIVIASAARH 
SAQNIAFHEV GRQAIMADPD WQDGQYYGSA RAPTKGLAVA RMAAHITYLS EAGLTEKFGR 
RLQARAIKSF GFDADFQVES YLRHQGLAFT DRFDANAYLY ITRAMDYFDL AEPHDGRLAG 
AFAGAKDVRF TLVSFDTDWL YPTAESRRIV QALQSVGAAA SFVELSAPFG HDSFLLDVPA 
LDRIVAGALG GGR