Gene Saro_1222 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1222
Symbol
ID	3916520
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1274354
End bp	1275568
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	68%
IMG OID	640443959
Product	acetyl-CoA acetyltransferase
Protein accession	YP_496501
Protein GI	87199244
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0492457
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCAGC TTCGCCACGC CGCCATCGTC GCCCCCATCC GCACCGCCGT GGGCAAGTTC 
GGCGGCTCGC TGTCGCCTCT CACCGCCGGG CAACTGGGCG CAACGATCCT CACGGCGCTG 
ATGGACCGCA CAAGGATCGA CCCCGCGCGC GTCGATGACG TGATCTTCGC GCAGGGTTAC 
GGCAACGGCG AGGCGCCGTG CATCTCGCAC TGGTCGTGGC TGCTCGCGGG CCTGCCCGAG 
GAAGTTCCCG GCTACCAGCT CGATCGCCGC TGCGGCTCGG GCCTCCAGTC GATCGTCAAT 
GCGGCGATGA TGGTGCAGAC CGGGGTTTCC GACGTCGTCG TGGCGGGCGG CGTGGAATCG 
ATGTCCAACG TCGAGCACTA TACCACTGAC GTCCGCAAGG GCGTGCGCGC GGGCTCGCTG 
ACCCTTCACG ACCGCCTTAC CCGTGGCCGC GTGATGAGCC AGCCGATCGA GCGCTATGGC 
GTGATCAGCG GCATGATCGA GACGGCGGAA AACCTCGCCA AGGACTTTGC CATCACCCGC 
GAAGCCTGCG ACGCCTATGC CGTGCGCAGC CACCAGCGCG CGGCTGCTGC ATGGGCCAAC 
GGCCTGTTCG ACGACGAACT CGTTCCGGTC TCCATCCCCC AGAAAAAGGG CGACCCCGTT 
CTCTTCGCCC ACGACGAGGG TTACCGTGCC GACGCCAGCA TGGAAACGCT TGGCAAGCTG 
CGCCCCCTCG AAGGCGGCGT CGTGACGGCA GGCAACGCCA GCCAGCAGAA CGACGCGGCC 
GCCGCCTGCC TCGTCGTCGC GGAAGACAAG CTCGCCGAAC TCGGCCTCGA ACCCATCGCG 
TGGTTCCATT CCTGGGCGGC AGCGGGCTGC GATCCGAGCC GCATGGGCTA TGGCCCTGTC 
CCCGCTACCG AGCGCCTGTT CGCCCGCAAC GGCCTGACGT GGAACGACAT CGACCTCATC 
GAACTGAACG AGGCCTTCGC CCCTCAGGTT CTCGCCTGCC TCAAGGGCTG GGGCTGGTCG 
GACGACGACA GCCGCCACGA GATGCTGAAC GTCAATGGCT CGGGCATCAG CCTCGGCCAT 
CCCATCGGCG CCACCGGCGG GCGCATCCTC GCCAACCTTA CGCGCGAATT GAAGCGGCGC 
GGCGGGCGCT ATGGCCTTGA AACCATGTGC ATTGGTGGCG GTCAGGGAAT CGCGGCGGTG 
TTCGAGGCGG CCTGA

Protein sequence

MTQLRHAAIV APIRTAVGKF GGSLSPLTAG QLGATILTAL MDRTRIDPAR VDDVIFAQGY 
GNGEAPCISH WSWLLAGLPE EVPGYQLDRR CGSGLQSIVN AAMMVQTGVS DVVVAGGVES 
MSNVEHYTTD VRKGVRAGSL TLHDRLTRGR VMSQPIERYG VISGMIETAE NLAKDFAITR 
EACDAYAVRS HQRAAAAWAN GLFDDELVPV SIPQKKGDPV LFAHDEGYRA DASMETLGKL 
RPLEGGVVTA GNASQQNDAA AACLVVAEDK LAELGLEPIA WFHSWAAAGC DPSRMGYGPV 
PATERLFARN GLTWNDIDLI ELNEAFAPQV LACLKGWGWS DDDSRHEMLN VNGSGISLGH 
PIGATGGRIL ANLTRELKRR GGRYGLETMC IGGGQGIAAV FEAA