Gene Sare_0148 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0148
Symbol
ID	5706588
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	160093
End bp	161385
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	72%
IMG OID	641269674
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001535074
Protein GI	159035821
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000426829
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGCAGAACA TCCGGCGGGT CGCGGTCATC GGCGGCAACC GCATCCCCTT CGCCCGCTCC 
AACTCACGGT ACGCCGAAGC GTCCAACGCG GACCTGCTCG GCGCGGCCCT CGACGGGCTG 
GTCGCCCGGT ACGGGCTGGC CGGCCAGCAG GTCGGCGAGG TGGTGGCGGG TGCCGTGCTG 
AAGCACTCCC GGGACTACAA CCTGACCCGC GAGGTGGTGC TCGGCTCGAC GCTCGACCCA 
CACACCCCCG CGTACGACAT CCAGCAGGCA TGCGGCACCG GCCTGGAGGC AGCCATCCTG 
GTCGCCAACA AGATTGCGCT GGGGCAACTC GACGTGGGCA TCGCCGGTGG TGTCGACACC 
ACGTCCGATG CGCCGCTTGC GGTGAACGAG GAGATGCGGC GCACGCTGCT CACCCTCAAC 
ACTGCCCGCA CCCTCGGGGA ACGGCTGCGG ATCGCCGCGC GGCTGCGCCC CTCGCAACCG 
TTCCGGCCGG AGATTCCGCG CAACGCCGAG CCCCGCACCG GGCTGTCCAT GGGAGAGCAT 
GCCGCCCGCA CCGCCGTCCA CTGGCAGGTC GACCGGCGGT CGCAGGACGA GCTGGCCCTG 
CGGTCGCACC ACCGGCTGGC CGCCGCGTAC GAGCGTGGGT TCTTCGACGA CCTGATGACG 
CCGTACCTCG GGTTGACCCG GGACCAGAAC CTGCGCCCGG ACACCAGCCT GGAGAAGCTC 
GGCGGCCTCC GCCCGGTCTT CGGGACGAAG GGGCCGGACG CCGAGCAGGC GACCATGACC 
GCCGGCAACT CGTCGCCGCT GACCGACGGC GCGTCGACCG TGCTGCTCGC CAGTGAGGAG 
TGGGCGCAGG CGCACAGCCT GCCGGTGCAG GCGTGGTTCA CCTGGTCGCA GACCGCCGCC 
GTGGACTTCG TGCCCGGTGA GGAAGGGCTG TTGATGGCCC CCGCGTACGC GGTGCCCCGG 
ATGCTGGCCC GCGCCGGGCT GACCCTCCAG GACTTCGACT TCTACGAGAT CCACGAGGCG 
TTCGCCGCGC AGGTCCTGGC CACTCTGGCT GCCTGGGAGT CGCCGGAGTT CTGCAGGGAC 
CGGCTCGGCC TGGACGCCCC GCTCGGAGCG ATCGACCCGG ACCGGATCAA CGTCAACGGC 
TCGTCGCTGG CCGCCGGGCA CCCGTTCGCC GCGACCGGCG GCCGGATCGT GGCGACCCTG 
GCCAAGCTGC TCGCCGAGCG AGGTGGCGGC CGAGGGCTCA TCTCGATCTG CGCCGCGGGC 
GGGCAGGGCG TCACGGCGAT CCTGGAGCGT TGA

Protein sequence

MQNIRRVAVI GGNRIPFARS NSRYAEASNA DLLGAALDGL VARYGLAGQQ VGEVVAGAVL 
KHSRDYNLTR EVVLGSTLDP HTPAYDIQQA CGTGLEAAIL VANKIALGQL DVGIAGGVDT 
TSDAPLAVNE EMRRTLLTLN TARTLGERLR IAARLRPSQP FRPEIPRNAE PRTGLSMGEH 
AARTAVHWQV DRRSQDELAL RSHHRLAAAY ERGFFDDLMT PYLGLTRDQN LRPDTSLEKL 
GGLRPVFGTK GPDAEQATMT AGNSSPLTDG ASTVLLASEE WAQAHSLPVQ AWFTWSQTAA 
VDFVPGEEGL LMAPAYAVPR MLARAGLTLQ DFDFYEIHEA FAAQVLATLA AWESPEFCRD 
RLGLDAPLGA IDPDRINVNG SSLAAGHPFA ATGGRIVATL AKLLAERGGG RGLISICAAG 
GQGVTAILER