Gene Saro_3556 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3556
Symbol
ID	5077705
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	+
Start bp	172529
End bp	173680
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	67%
IMG OID	640481280
Product	Acetyl-CoA acetyltransferase-like protein
Protein accession	YP_001165942
Protein GI	146275782
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGGCG ACGTCTGCAT CGTCGGCATC GGCATCCACC CGTTCGGGCG CACCGACGGG 
CTATCGGGGC TGGAGCAGGG CGTCTTTGCC GTGCGCCAGG CACTGGGAGA TGCCGGAATC 
GAGTGGGGCG ACGTCCAGTT CGCCTATGGC AGCTCGGATT CCGCCGGCAA CCCCGACACG 
ATGGTCGACC GGCTGGGCCT TACGGGCATG CAGTTCATCA ACGTGCGCAA CGGGTGCGCT 
GCGGGCGGAT CGGCGCTGTT CTCGGCGCAG ATGGCGATCA AGAGCGGCGA GTTCGACATC 
GGCCTTGCCG TCGGCTTCGA CAAACATCCG CGCGGCGCGT TCAATGCCAT GCCGAGCGAG 
TACAACCTGC CCGACTGGTA CGGCGAGGCG GGCTACATGA TCACCACGCA GTTCTTCGCG 
AACAAGATCA TGCGCTACAT GCACGATCAC GGCATCAGCC AGCAGACGCT GGGCCGGGTG 
GCGGAAAAGG CTTTCCGCAA CGCGGTGCAT GCCGATCACG CCTGGCGGCG CGAGCCGGTG 
GACCTCGAGA CGATCCTCGA GGCGCCGCTG GTTTCCGACC CCTATACCAA GTACATGTTC 
TGCTCGCCCG CCGAAGGCGG CGTCGCGCTG ATCCTGGCGA GCGAAAAGAA GGCGCGCGAA 
CTGGGCAAGC CGCTGGTCCG CCTGAAGGCC GCGACGATGC GCACCCGGCC GCCCAAGTCG 
TTCGAGGTCT TCGCACCCTC GATCGATATC GGCGGCGGCA AGGCGACCGC GACCCAGATC 
GCCAGCGCCG ACGCGTTCCG CATGGCCGGC ATCGGGCCCG GCGACATCGC AGTCGCCCAG 
CTCCAGGATA CCGAGGCCGG CGCCGAGATC ATGCACATGG CCGAGAACGG CTTCTGCAAG 
GACGGCGAGC AGGAGCGCTG GCTGGCCGAA GGGCTGACCG AGGTGGGCGG CAAGCTGCCG 
GTCAACACCG ACGGCGGCTG CCTTGCCTGC GGCGAACCCA TCGGCGCTTC GGGCCTGCGA 
CAGGTCTACG AGAACGTCGT GCAACTTCGC GGGGACGGCG GCGGGCGCCA GGTGCCCGGC 
AATCCCAAGA CCGCATACAG CCACGTCTAT GGCGCCCCGG GCGTCTCTGC CGTGACCATT 
CTGGAACGCT GA

Protein sequence

MSGDVCIVGI GIHPFGRTDG LSGLEQGVFA VRQALGDAGI EWGDVQFAYG SSDSAGNPDT 
MVDRLGLTGM QFINVRNGCA AGGSALFSAQ MAIKSGEFDI GLAVGFDKHP RGAFNAMPSE 
YNLPDWYGEA GYMITTQFFA NKIMRYMHDH GISQQTLGRV AEKAFRNAVH ADHAWRREPV 
DLETILEAPL VSDPYTKYMF CSPAEGGVAL ILASEKKARE LGKPLVRLKA ATMRTRPPKS 
FEVFAPSIDI GGGKATATQI ASADAFRMAG IGPGDIAVAQ LQDTEAGAEI MHMAENGFCK 
DGEQERWLAE GLTEVGGKLP VNTDGGCLAC GEPIGASGLR QVYENVVQLR GDGGGRQVPG 
NPKTAYSHVY GAPGVSAVTI LER