Gene Arth_1318 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1318
Symbol
ID	4446172
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	1479414
End bp	1480598
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	68%
IMG OID	639689126
Product	homoserine O-acetyltransferase
Protein accession	YP_830812
Protein GI	116669879
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGATTG CCGTCACCCG CAGCGGTGTA CCCGAAACAT CCAGCCACAG CCTGTCAGCC 
CGTGACGTGA AAACCACCGC GGGCAAAACC GCAGGCACTG TCCCCGACGG TACCGTCAGG 
TTCCAGGGCA TCGGCGGGCT TGACCTTGAA GCCGGCGGGC ATCTGCCGGA CGTCACACTC 
GCCTACGAGA CGTGGGGCAC GCTGAACGCG GACCGTTCCA ACGCCGTGCT GGTGCAGCAT 
GCCCTGACCG GCAGCACGCA CGTTACCAGG GGAGCCAGTG ACGAAGAAGG CTGGTGGGAG 
CAGCTTGCCG GGCCCGGCGC CCCGGTTGAT ACGGACAAGT ACTTCGTGGT TTCCATCAAC 
ATCCTGGGCG GTTGCTACGG CTCCACCGGG CCTTCCACTC CCGCGCCGGA CGGCAGGCCG 
TGGGGCTCGC GCTTCCCCCT GGTGACCCTG CGCGACACCA CTGCGGCCGA GGCCCGGTTG 
GCGGACGCCC TTGGCATCGA CAGCTGGTAC GCCGTCCTGG GCGGATCCCT GGGTGGAGCC 
CGCGCCTTGG AATGGGCCGT TAGCTTCCCT GACCGGGTCC GGCGCTGTGC CGTCATTTCC 
ATCGGGGCCA GCAGCACTGC CGAGCAGATC GCCTTTGCCC AGGCGCAGAC CCTCGCCATC 
CGCCAGGACG TCAACTTCAA CGGCGGTGAC TACTACGGCG GCCCGGAGCC TGAGGCCGGC 
CTGGCCCTGG CGCGCAGGAT CGCGCACATC ACGTACCGCT CCGCAGACGA GCTGGAGGCC 
CGGTTCGGCC GGAGCGCCCA GGGCGGCGAA GCCCCGCTTC AGGCAGTCTC GCTGGGAGAC 
CGCGGCCGCT ACCAGGTGGA GAGCTACCTC GACCATCAGG GCACCAAGCT GGTCCGCCGC 
TTCGATGCCA ACAGCTACAT CGCCATCACG GAAGCGCTCA TGAGCCACGA CGTCGGCCGG 
GGACGCGGCC CGCTCAAGGA CGCGCTGGCC CAGGCCAAGG CTGAGTTCTT CATCGCCGCC 
GTTAACACCG ACCGGCTGTA TTTTCCTGCA CAGTCCCGCG AACTGGCGGC GGCACTGCCG 
GGCGACGTCC CGGTGCACAT CATCGAGGCG CCCATCGGCC ACGACGGTTT CCTGACTGAA 
ATCGGGCAGC TTAGCGCGCA GCTGAGGCAG AACTTTTTCG CCTAG

Protein sequence

MTIAVTRSGV PETSSHSLSA RDVKTTAGKT AGTVPDGTVR FQGIGGLDLE AGGHLPDVTL 
AYETWGTLNA DRSNAVLVQH ALTGSTHVTR GASDEEGWWE QLAGPGAPVD TDKYFVVSIN 
ILGGCYGSTG PSTPAPDGRP WGSRFPLVTL RDTTAAEARL ADALGIDSWY AVLGGSLGGA 
RALEWAVSFP DRVRRCAVIS IGASSTAEQI AFAQAQTLAI RQDVNFNGGD YYGGPEPEAG 
LALARRIAHI TYRSADELEA RFGRSAQGGE APLQAVSLGD RGRYQVESYL DHQGTKLVRR 
FDANSYIAIT EALMSHDVGR GRGPLKDALA QAKAEFFIAA VNTDRLYFPA QSRELAAALP 
GDVPVHIIEA PIGHDGFLTE IGQLSAQLRQ NFFA