Gene Sare_2812 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2812
Symbol
ID	5707004
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	3194542
End bp	3195705
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	71%
IMG OID	641272268
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001537638
Protein GI	159038385
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000975641
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGGCACTC CGGTGATCGT TGACGCGGTT CGTACGCCGA TCGGGAAACG CGGTGGTTGG 
CTGGCGGGAC TACACGCCGC CGAACTCCTG GGCGCGGCCC AACGTGCCCT CGTCGAACAC 
GTGGACCTCG ACCCGGGCGC GGTCGAGCAG GTCGTCGGCG GGTGCGTCAC CCAGAGCGGT 
GAACAGTCCA ACAACGTCAC CCGCACCGCC TGGTTGCACG CCGGCCTGCC GTACCAGACA 
GGCTGCCTCA CCATCGACGC ACAGTGCGGA TCCTCCCAGC ACGCCGCCCA TCTTGTCGCC 
GGGCTCATCG CCACCGACGC CGTCGAGGTG GGCATCGCCT GCGGTGTCGA GGCGATGAGC 
CGGGTGCCGC TGCGGGCGAA CCTCGGCGTC GACGTCGGCA CGCCCCGTCC GGCGTCGTGG 
CACATCGACC TGCCCAACCA GTACGTCGCC GCCGAGCGGA TCGCGGTACG GCGAGGCTTG 
TCCCGCACGA CGGTCGACGA GTTCGGCATG CGCTCGCAGG TCAGGGCGGC CCGGGCCTGG 
ACGCAGGGGT ACTACGACCG CGAGGTCGTG GCGGTGCACG CGCCGGCACT CGACGCCGAG 
GGACAGCCGA CCGGAGAAAC CCGTGTCATC GACCGGGACC AAGGGCTGCG CGATACCACG 
ATGGAGGCGC TGAGCCGGCT GCGGCCGGTG GTCGAGGACG GGCTGCACAC TGCCGGGACC 
TCGTCGCAGA TCTCCGACGG CGCCGCGGCG GTCCTGCTCA TGTCCGCCGA CCGGGCCCAC 
GCGCTCGGTC TGCGCCCAAG GGCCAGAATC GTCGCCCAGT GCCTGGTCGG CGCCGAACCC 
CACTACCACC TGGACGGCCC CGTGCAGGCA ACCGAGCGGG TGCTGGCCCA CGCCGGCATG 
AAGATCCAGG ATATTGATCG GTTCGAGGTC AACGAGGCGT TCGCCGCCGT CGTGCTGTCC 
TGGCTGTCGG CGCACCAGGC CGACCCGGAG AAGGTGAACG TCAATGGCGG CGCGATCGCG 
CTCGGGCATC CGGTGGGCAG TACCGGGGCC CGGCTGCTCA CCACCGCCCT GCACGAGCTG 
GAGCGGACGG CTACCCGCAC GGCGTTGATC ACCATGTGCG CTGGCGGCGC CATGTCCACC 
GCGACCATCA TCGAACGACT CTGA

Protein sequence

MGTPVIVDAV RTPIGKRGGW LAGLHAAELL GAAQRALVEH VDLDPGAVEQ VVGGCVTQSG 
EQSNNVTRTA WLHAGLPYQT GCLTIDAQCG SSQHAAHLVA GLIATDAVEV GIACGVEAMS 
RVPLRANLGV DVGTPRPASW HIDLPNQYVA AERIAVRRGL SRTTVDEFGM RSQVRAARAW 
TQGYYDREVV AVHAPALDAE GQPTGETRVI DRDQGLRDTT MEALSRLRPV VEDGLHTAGT 
SSQISDGAAA VLLMSADRAH ALGLRPRARI VAQCLVGAEP HYHLDGPVQA TERVLAHAGM 
KIQDIDRFEV NEAFAAVVLS WLSAHQADPE KVNVNGGAIA LGHPVGSTGA RLLTTALHEL 
ERTATRTALI TMCAGGAMST ATIIERL