Gene Tcr_1839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tcr_1839
Symbol	metX
ID	3761052
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thiomicrospira crunogena XCL-2
Kingdom	Bacteria
Replicon accession	NC_007520
Strand	+
Start bp	2013967
End bp	2015124
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	46%
IMG OID	637786583
Product	homoserine O-acetyltransferase
Protein accession	YP_392105
Protein GI	78486180
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0107828
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGATG AAATTGGTAT AGTAACCCCT CAAAAACTCC ATGTTTCGAC CCCTCTTGAG 
ATGGTCAGTG GCTCCACTTT GCCTGAATAT GACCTGGCCT ACGAAACCTA CGGCAGCCTA 
AATGCCGATA AAAGTAATGC CATTTTAATT TGCCATGCAT TAAGTGGAAA CCATCATGTG 
GCCGGTCAAT ATGAAGGGGA ATCAACCAGA GGTTGGTGGG ATGGCTATAT TGGTCCAGGG 
AAACCGATCG ATACCAATCG TTTTTTTGTG GTCTGCTCCA ATAATCTAGG CGGTTGCCAT 
GGTTCAACAG GTCCTGCCAG TATCAACCCC CTAACCGGAA AAGTGTACGG ACCTGACTTT 
CCGATTGTGA CCTGTAAAGA TTGGGTACAC AGCCAAAACA CGCTGCGTCA ACATTTAGAA 
ATCGATGCCT GGGCGGCCGT CATTGGGGGA TCAATGGGCG GCATGCAAGT TTTACAATGG 
ACCATCGACT TTCCCGATCA AATTCGTCAT GCCATTGTGA TTGCCTCTGC ACCTAAATTA 
TCGGCACAAA ACATTGCATT CAACGAGGTC GCACGTCGTG CCATTATGAC CGACCCCGAC 
TTTCATGACG GTCGCTTTAT CGAAGCCGGC ACCACGCCGA AAAGAGGATT GGCTTTAGCT 
CGAATGCTAG GACATCTAAC CTATTTATCC GATGATATGA TGGGTTCAAA ATTCGGTCGT 
GAACTGCGAG AGGGCAAACT TAATTATAAC TTTGATGTGG AATTTCAGGT TGAGAGCTAC 
CTTCGCTACC AGGGTGAAAA GTTTGCAACA AAACAAAACT TTGACGCGAA CACCTATTTA 
CTAATGACCA AAGCGTTGGA TTATTTTGAC CCTGCCGCCG ACTTTGATGA TGATCTATCC 
AAAGCCCTTT CTGGCGCAAC GGCAAAATTT TTGATCATTT CATTTACCAC TGATTGGCGT 
TTCTCCCCTG AGCGATCACA TGAAATCGTT AAGGCCTTAC TCGATAACGA TGCCGACATC 
AGTTATGCCG AAGTGAATTC ACAGCATGGA CATGATGCCT TTTTATTGCC GAATGACCAT 
TATGAAGGTG TTTTTCGTGC CTATATGAAA CGAATTCATG CCGAATTAAA CCACACCTCT 
TTGCAGGAAG GAGAATAG

Protein sequence

MTDEIGIVTP QKLHVSTPLE MVSGSTLPEY DLAYETYGSL NADKSNAILI CHALSGNHHV 
AGQYEGESTR GWWDGYIGPG KPIDTNRFFV VCSNNLGGCH GSTGPASINP LTGKVYGPDF 
PIVTCKDWVH SQNTLRQHLE IDAWAAVIGG SMGGMQVLQW TIDFPDQIRH AIVIASAPKL 
SAQNIAFNEV ARRAIMTDPD FHDGRFIEAG TTPKRGLALA RMLGHLTYLS DDMMGSKFGR 
ELREGKLNYN FDVEFQVESY LRYQGEKFAT KQNFDANTYL LMTKALDYFD PAADFDDDLS 
KALSGATAKF LIISFTTDWR FSPERSHEIV KALLDNDADI SYAEVNSQHG HDAFLLPNDH 
YEGVFRAYMK RIHAELNHTS LQEGE