Gene Sare_3991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3991
Symbol
ID	5706666
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4539925
End bp	4541124
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	68%
IMG OID	641273416
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001538772
Protein GI	159039519
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000808201
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCTTCGG TGATCGTCAG CGGCGCTCGA ACCCCGATGG GGCGGCTGCT GGGTAACCTC 
AAGGACGTTC CCGCGACCCG GCTCGGTGCC GTGGCGATAA AGGCGGCGCT CGAGCGCGGC 
CAGGTCGCCC CCGACCAGGT TCAGTACGTG ATCATGGGGC AGGTGCTTCA GGCGGGCGCT 
GGCCAGATCC CAGCGCGCCA AGCGGCTGCC GAGGCGGGCA TCCCGTTGTC CGTCCCGGCG 
CTCACCGTTA ACAAGGTCTG CCTCTCCGGC CTGGACGCGA TCGCTCTGGC CGACCAGTTG 
ATCAGAGCCG GTGAGTTCGA TGTCGTCGTG GCCGGCGGCA TGGAGTCGAT GACCAATGCC 
CCGCATCTGC TGCTGGGCCA GCGCGGTGGC TACAAGTACG GCGATGTGGT GATCAAGGAT 
CACATGGCCC TCGACGGGCT TACCGATGCC TGGGACTGCT GCTCGATGGG AGAGTCGACC 
GAACGGCACG GCAGCACCAA GGGCATCAGT CGCGCAGAGC AGGACGCGTT CGCCGCGGCG 
AGTCACCAGC GCGCCGCCGC CGCTCAGAAG AACGGGTACT TCGCCGACGA GATCACCCCG 
GTGGTCCTCC CACAGCGCAG GGGGGAACCG CTGGTGATCA GCGAGGACGA GGGTATCCGT 
CCGGACACCA CCGTCGAGTC GCTGGCAAAG TTGCGTCCGG CTTTCACTCG GGACGGCAGC 
ATCACCGCCG GCAGCTCGTC GCCGATTTCC GACGGGGCCG CCGCCGTCGT CGTGATGAGC 
AGGGCCAAGG CCAAGGAGCT GGGGCTGAGC TGGCTGGCGG AAATCGGCGC ACACGGCAAC 
GTCGCCGGCC CGGACAACTC GCTGCACTCG CAGCCGTCCA ACGCGATCGG GCACGCGCTC 
CGGAAGGCTG GCCTGACCAT CGACGATCTT GACCTTATTG AGATCAACGA GGCGTTCGCG 
CAGGTGGGCA TCCAGTCGGC CCGTGATCTT GGCGTGAGTC AGGACAAGGT CAACGTCAAT 
GGCGGCGCGA TCGCGCTTGG TCACCCGATC GGCATGTCGG GTGCCCGGCT GGTCCTGACC 
CTGGCGCTGG AGCTGAAGCG GCGCGGTGGC GGCACCGGGG CGGCGGCGCT CTGCGGCGGT 
GGTGGGCAGG GCGATGCGTT GATCATTCAC GTCCCAGCGG GCGCCGAGAG CCAGGGGTGA

Protein sequence

MASVIVSGAR TPMGRLLGNL KDVPATRLGA VAIKAALERG QVAPDQVQYV IMGQVLQAGA 
GQIPARQAAA EAGIPLSVPA LTVNKVCLSG LDAIALADQL IRAGEFDVVV AGGMESMTNA 
PHLLLGQRGG YKYGDVVIKD HMALDGLTDA WDCCSMGEST ERHGSTKGIS RAEQDAFAAA 
SHQRAAAAQK NGYFADEITP VVLPQRRGEP LVISEDEGIR PDTTVESLAK LRPAFTRDGS 
ITAGSSSPIS DGAAAVVVMS RAKAKELGLS WLAEIGAHGN VAGPDNSLHS QPSNAIGHAL 
RKAGLTIDDL DLIEINEAFA QVGIQSARDL GVSQDKVNVN GGAIALGHPI GMSGARLVLT 
LALELKRRGG GTGAAALCGG GGQGDALIIH VPAGAESQG