Gene Arth_2986 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2986
Symbol
ID	4444508
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	3354284
End bp	3355483
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	69%
IMG OID	639690809
Product	acetyl-CoA acetyltransferase
Protein accession	YP_832465
Protein GI	116671532
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAACT CCCCAGACAA CAATGATGTT GTCATCCTCG CTGCGGCCCG CACGCCGCAG 
GGGCGCCTGA ACGGCCAGCT AGCCGGCTTC ACGGCGGTGG AGCTCGGGGC GCACGCCATC 
AAGGCGGCCC TGGCTGCGAG CGGCGTTGCC GCGGAGCAGG TGGATGCGGT CATCATGGGC 
CAGGTCCTGC AGGCGGGAGC GGGCCAGAAC CCCGCGCGGC AGAGCGCCAT CGGCGCCGGC 
ATCGGCTGGA ACGTCCCCAC GGTCACTATC AACAAAGTGT GCCTTTCCGG CCTCACGGCC 
GTGATCGACG CCGCCCGCAT GATCCGCAGC GGTGACGCCG CCGTCGTCGT CGCCGGCGGT 
CAGGAATCCA TGTCCCGGGC GCCGCACATC CTGCCGGGTT CCCGGCAGGG TTGGACCTAC 
GGGACTGTCC AGGCGCTGGA CGTGGCCGCG CATGACGGCC TGACCGACGC CTTCGACGGA 
CAATCCATGG GGCTGTCCAC GGAAAGCAAG AACCTGGTTC TGGGCATCGA CCGGACCTCG 
CAGGACAACG TGGCAGCCCA GTCCCACCAG CGCGCCGCCC TGGCCGCGAA GAACGGAGTT 
TTCGACGACG AAATCGCCCC GATCAGCGTC AAACAGCGGA GGGGGGACCC GGTGGTGGTG 
GCCACCGACG AAGGCGTGCG CCCGAACACG TCGGTCGAGT CGCTGGCCGG TCTCCGTGCC 
GCGTTCGTCA GCGACGGCAC CATCACGGCA GGCAACTCCT CTCCCCTGTC CGACGGCGCT 
GCCGCCCTGG TATTGACCAC CCGGAAGTTC GCGGAAGACA ACGGCCTGGA CTACCTCGCA 
GTTGTGGGCA AGCCGGGCCA GGTTGCGGGC CCGGACAATT CGCTGCACTC GCAGCCGTCC 
AATGCAATCA AGAGCGCCTT GGACCGTGCC GGATGGACCA CCGCGGACCT CGACTTCATT 
GAGATCAACG AGGCCTTCGG TTCCGTTGCC GTCCAGTCGC TCAAGGACCT CCAGTACCCG 
CTGGAGAAGT GCAACATCCA TGGCGGCGCC ATCGCGCTCG GGCACCCCAT CGGGGCCTCA 
GGCGCCCGCC TGGCCGGACA TGCCGCGCAC GAGCTGAAAC GCCGCGGCTC CGGCAAGGCC 
GCTGTATCCC TGTGCGGCGG CGGCGGGCAG GGCGAAGCCC TCCTCCTCTA CCGGGACTGA

Protein sequence

MSNSPDNNDV VILAAARTPQ GRLNGQLAGF TAVELGAHAI KAALAASGVA AEQVDAVIMG 
QVLQAGAGQN PARQSAIGAG IGWNVPTVTI NKVCLSGLTA VIDAARMIRS GDAAVVVAGG 
QESMSRAPHI LPGSRQGWTY GTVQALDVAA HDGLTDAFDG QSMGLSTESK NLVLGIDRTS 
QDNVAAQSHQ RAALAAKNGV FDDEIAPISV KQRRGDPVVV ATDEGVRPNT SVESLAGLRA 
AFVSDGTITA GNSSPLSDGA AALVLTTRKF AEDNGLDYLA VVGKPGQVAG PDNSLHSQPS 
NAIKSALDRA GWTTADLDFI EINEAFGSVA VQSLKDLQYP LEKCNIHGGA IALGHPIGAS 
GARLAGHAAH ELKRRGSGKA AVSLCGGGGQ GEALLLYRD