Gene Amir_6239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_6239
Symbol
ID	8330450
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	7318588
End bp	7319619
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	77%
IMG OID	644946670
Product	homoserine O-acetyltransferase
Protein accession	YP_003103889
Protein GI	256380229
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACGGGGT GGCGCGACGG CGATCCGGCC GGTGGGAGGA AGTGGCACCG GGGCGCGCTG 
CCCGGTCTGC CGTTCCGGCT CGCCTACGAG ACCTGGGGCG AGCCTGACGA CGACCGGTCC 
AACGCGGTGC TCGTGCTGCA CGCCCTCACC GGGGACAGCC ACGTCGCCGG ACCCGCCGGT 
CCCGGCCACC CGACCGCCGG GTGGTGGGAC GGGCTGGTGG GGCCCGGCCT GGCGCTGGAC 
ACCGACCGGT GGTTCGTCGT CGCGCCCAAC GCGCTGGGCG GCTGCCAGGG CAGCACCGGC 
CCGTGGGACA CCGCGCCCGA CGGGCGGCCC TGGGGCGAGC GGTTCCCCGC CGTCGGCATC 
CGCGACCAGG TGCGGGCCGA GCTGGGGCTG GCCGACGCGC TCGGCGTGCG CTCGTGGGCG 
GCGGTCGTCG GCGGGTCCAT GGGCGGGATG CGGGCGCTGG AGTGGGCGGT GACCGCGCCC 
GAGCGGGTGC GGTCGCTGCT GGTGCTCGCG GCCCCCGCCG CGTCCGGCGC CGACCAGATC 
GCGCTCGCCT CGGCCCAGCT GCACGCCCTC AAGCTGCACC CGCAGGAGGG GATGGCGGTG 
GCCAGGCGGA TCGCCCACCA CGGGTACCGC ACCGCCGCCG AGCTCAACGC CCGGTTCGGG 
CGGAGCGTCC AGGGGGACGG GCGGTTCGCC GTCGAGTCCT ACCTGGACCA CCAGGCGGAC 
AAGCTGGCCG GGAGGTTCGA CCCCGGCAGC TACCGGGTGC TCACCGAGGC CATGAACGGC 
CACGACGTGG GCCGGGGCCG GGGAGGGGTG CGCGCGGCGC TGGGCGCGGT GACCGCGCGC 
ACCCTCGTCG CCGGGATCGA CACCGACCGG CTCTACCCGC TGGAGCAGCA GCGGGAGCTG 
GCCGAGGCGA TCCCCGCAGC GGGCGACCTG CGCGTCGTGG CCTCGCCGTA CGGCCACGAC 
GGGTTCCTCG TCGAGGAGGA GCAGGTCGCC GCGCTGCTGG GGGAACTGCT GCGGGTCAGA 
AGCCCGCGGT GA

Protein sequence

MTGWRDGDPA GGRKWHRGAL PGLPFRLAYE TWGEPDDDRS NAVLVLHALT GDSHVAGPAG 
PGHPTAGWWD GLVGPGLALD TDRWFVVAPN ALGGCQGSTG PWDTAPDGRP WGERFPAVGI 
RDQVRAELGL ADALGVRSWA AVVGGSMGGM RALEWAVTAP ERVRSLLVLA APAASGADQI 
ALASAQLHAL KLHPQEGMAV ARRIAHHGYR TAAELNARFG RSVQGDGRFA VESYLDHQAD 
KLAGRFDPGS YRVLTEAMNG HDVGRGRGGV RAALGAVTAR TLVAGIDTDR LYPLEQQREL 
AEAIPAAGDL RVVASPYGHD GFLVEEEQVA ALLGELLRVR SPR