Gene Arth_0489 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0489
Symbol
ID	4447044
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	519550
End bp	520734
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	69%
IMG OID	639688286
Product	acetyl-CoA acetyltransferase
Protein accession	YP_829988
Protein GI	116669055
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.201568
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCTGC GCGAACAGTT CGGTAAAGAT GTCCTGCTCA CCGGCTGGGG CCACAGCCGC 
TTCGGCAAAC TCACGGACGA CACCCTGGAG TCCCTGATCG TCCAGGTCGC CACGGAGGCG 
ATCGGCAACG CCGGGATCGA CCCGGGCCAG ATCGATGAGA TCTACCTGGG CCAGTTCAAC 
TCCGGCATGA TGCCGCTGGC GTTCCCGTCC TCGCTGGCCC TGCAGGTCTC GGAGCAGCTG 
GCCAACGTCC CCTCCACCCG GGTGGAAAAC GCCTGCGCAT CCGGCTCGGC TGCGTTCCAG 
CAGGGCACCA AGTCGCTGCT GGCCGGTACC GCGAAGACGG TCCTCGTGAT CGGCGCCGAA 
AAGATGACCC ACGCAGGTGC GGACGTCGTC GGGGCGGCCC TGCTGGGTGC CGACTACGAC 
ATGGCCGGCA AGGCCTCCAC CACAGGCTTC ACCGGCCTGT TCGCCGAGGT CGCCAAGCAC 
TACGAGAAGC GCTACGGACC GGTGTCCGAT GTCCTGGGCA CCATCGCGGC AAAGAACCAC 
CGCAACGGCG TCGACAACCC CTACGCCCAG CTCCGCAAGG ACCTCGGCGA GGAGTTCTGC 
CGCACCGTTT CGGACAAGAA CCCGATGGTG GCGGACCCGC TGCGCCGCAC CGACTGCTCC 
CCCGTGTCCG ACGGCGCCGC CGCGGTCGTG CTGTCTGTCT CGCCTACCGG CGGGGCCACC 
GCCCCGGTAC GGCTCGCCGG CATCGGCCAC GCGAACGATT TCTTCCCGGC CGAAAGGCGG 
GACCCCACCG CCTTCGCCGC AACCCGCGTC TCCTGGCAGC GCGCGCTGGG GATGGCCGGC 
GTCGGGCTGG AGGACCTGGA CTTCGCCGAA GTGCATGACT GCTTCACCAT CGCCGAACTG 
CTCATGTATG AGGCCATGGG ACTGACCGAA CCCGGCCAAG GTGCCCGCGC CGTCGAGGAA 
GGCTGGGTCT TCAAGGACGG CAAGCTGCCC ATCAACGTGT CCGGCGGGCT CAAGGCCAAG 
GGCCACCCCG TGGGTGCCAC CGGCGTCTCG CAGCACGTCA TCGCAGCCAT GCAGCTCACC 
GGCACCGCGG GCGGCATGCA GCTCGCCAAC CCCCGCCGCG CCGCCGTGCA GAACATGGGC 
GGGGTGGGCA TCGCCAACTA CGTGAGCGTC CTCGAGGCGG TCTAG

Protein sequence

MSLREQFGKD VLLTGWGHSR FGKLTDDTLE SLIVQVATEA IGNAGIDPGQ IDEIYLGQFN 
SGMMPLAFPS SLALQVSEQL ANVPSTRVEN ACASGSAAFQ QGTKSLLAGT AKTVLVIGAE 
KMTHAGADVV GAALLGADYD MAGKASTTGF TGLFAEVAKH YEKRYGPVSD VLGTIAAKNH 
RNGVDNPYAQ LRKDLGEEFC RTVSDKNPMV ADPLRRTDCS PVSDGAAAVV LSVSPTGGAT 
APVRLAGIGH ANDFFPAERR DPTAFAATRV SWQRALGMAG VGLEDLDFAE VHDCFTIAEL 
LMYEAMGLTE PGQGARAVEE GWVFKDGKLP INVSGGLKAK GHPVGATGVS QHVIAAMQLT 
GTAGGMQLAN PRRAAVQNMG GVGIANYVSV LEAV