Gene Dshi_3066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_3066
Symbol	atoB
ID	5710918
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	+
Start bp	3234503
End bp	3235678
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	67%
IMG OID	641268993
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001534400
Protein GI	159045606
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAATG TCGTAATCGC ATCCGCCGCG CGTACTGCCG TCGGCAGCTT CGGCGGATCC 
TTTGCCAACA CGCCTGCCCA TGACCTGGGC TCCGCCGTGC TCGAAGCGCT GGTAGCGCGC 
GCGGGGATCG AGAAGGGAGA AGTCTCCGAG ACCATCCTCG GCCAGGTGTT GACCGGCGGC 
CAGGGCCAGA ACCCGGCGCG CCAGGCGCAT ATCAACGCAG GCCTGCCGCA GGAAAGCGCG 
GCCTGGGGTC TCAACCAGGT GTGCGGCTCG GGCCTGCGCG CGGTCGCCCT CGGCGCCCAG 
CACATCCAGC TCGGCGATGC GGAGATCGTC TGCGCCGGCG GCCAGGAAAA CATGACGCTC 
AGCCCCCATG TGGCCAACCT GCGCGCGGGC CAGAAGATGG GCGACATGAA GTTCATCGAC 
TCGATGATCC GCGACGGCCT CTGGGACGCG TTCAACGGCT ACCACATGGG CCAGACCGCC 
GAAAACGTCG CCGAGAAGTG GCAGATCAGC CGCGAGATGC AGGACGAGTT CGCCGTCGCC 
AGCCAGAACA AGGCCGAGGC CGCCCAGAAG GCGGGCAAGT TCGATGACGA GGTGGTGGCC 
TTCACCATCA AGACCCGCAA GGGCGACATC GTCGTGGACA AGGACGAGTA CATCCGCCAC 
GGCGCGACCA TGGAGGCCAT GCAGAAACTG CGCCCGGCCT TCACCAAGGA CGGCTCGGTC 
ACGGCGGCCA ATGCGTCGGG GCTGAACGAC GGCGCGGCCG GCGTTCTGCT GATGTCGGCG 
GAAAATGCCG AGAAGCGCGG GATCACCCCG ATGGCGCGCA TCGCGTCCTA CGCCACCGCC 
GGGCTCGACC CGTCGATCAT GGGCGTCGGG CCGATCTATG CCTCGCGCAA GGCGCTGGAG 
AAGGCCGGGT GGAAGGTCGA CGACCTGGAC CTGGTGGAAG CCAACGAAGC CTTCGCCGCC 
CAGGCCTGTG CCGTGAACAA GGACATGGGC TGGGATCCGG CGATCGTGAA CGTGAACGGC 
GGCGCAATCG CCATCGGTCA CCCGATCGGC GCCTCCGGCG CGCGGGTTCT CAACACCCTG 
CTGTTCGAAA TGCAGCGGCG GGATGCCAAG AAGGGCCTTG CCACGCTGTG CATCGGCGGC 
GGCATGGGCG TGGCGCTCTG CGTCGAGCGC CCCTGA

Protein sequence

MTNVVIASAA RTAVGSFGGS FANTPAHDLG SAVLEALVAR AGIEKGEVSE TILGQVLTGG 
QGQNPARQAH INAGLPQESA AWGLNQVCGS GLRAVALGAQ HIQLGDAEIV CAGGQENMTL 
SPHVANLRAG QKMGDMKFID SMIRDGLWDA FNGYHMGQTA ENVAEKWQIS REMQDEFAVA 
SQNKAEAAQK AGKFDDEVVA FTIKTRKGDI VVDKDEYIRH GATMEAMQKL RPAFTKDGSV 
TAANASGLND GAAGVLLMSA ENAEKRGITP MARIASYATA GLDPSIMGVG PIYASRKALE 
KAGWKVDDLD LVEANEAFAA QACAVNKDMG WDPAIVNVNG GAIAIGHPIG ASGARVLNTL 
LFEMQRRDAK KGLATLCIGG GMGVALCVER P