Gene Smed_3117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3117
Symbol
ID	5323996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	3266553
End bp	3267734
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	66%
IMG OID	640792067
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001328778
Protein GI	150398311
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAATC CCTCGATCGT CATCGCCAGC GCCGCCCGCA CGGCCGTCGG CTCCTTCAAT 
GGCGCCTTCG GCAATACGCC TGCGCACGAA TTGGGCGCGG CCGCGGTCAA GGCGGTTCTG 
GAGCGGGCCG GTGTCGAAGC CGGCGAAGTG GACGAGGTGA TCCTCGGGCA GGTGCTGCCG 
GCGGGCGAGG GGCAGAATCC GGCGCGCCAG GCGGCGATGA AAGCCGGAGT CCCGCAGGAA 
AAGACCGCCT GGGGCATGAA TCAGCTCTGC GGCTCCGGCC TGCGCGCCGT GGCGCTCGGC 
ATGCAGCAGA TCGCAACCGG TGATGCGAAG GTCATCGTCG CCGGCGGCAT GGAGTCGATG 
TCCATGGCGC CGCATTGCGC GCACTTGCGG GGCGGCGTGA AAATGGGCGA TTACAAGATG 
ATCGACACGA TGATCAAGGA CGGCCTGACG GACGCCTTCT ATGGATATCA CATGGGCACT 
ACCGCGGAGA ACGTCGCGCG GAAATGGCAG CTTACGCGCG AGGAGCAGGA CGAATTCGCG 
CTGGCCTCCC AGAACAAGGC CGAAGCCGCC CAGAAAGCCG GCCGCTTCGC CGACGAGATC 
GTTCCTTTCG TCGTCAAGAC GCGGAAAGGC GACGTCACTG TCGACCAGGA CGAATACATA 
CGTCACGGCG CCACGCTGGA ATCGATTGCG AAGCTTCGCC CGGCTTTCGA CAAGGAAGGC 
ACCGTCACTG CCGCCAACGC GTCGGGCCTC AATGACGGCG CCGCCGCCGC TCTGCTGATG 
ACCGAGGCCG AGGCCGGCCG GCGCGGCATC CAGCCGCTTG CCCGCATCGT CTCCTGGGCC 
ACGGCGGGCG TCGACCCGCA GATCATGGGC ACGGGCCCGA TCCCCGCATC GCGCAAGGCA 
CTTGAAAAAG CCGGCTGGTC GGTCGCCGAA ATTGAACTCG TAGAGGCCAA CGAGGCCTTC 
GCGGCCCAGG CATGCGCCGT CAACAAGGAT CTCGGTTGGG ACCCGTCGAT CGTCAACGTC 
AATGGCGGCG CGATCGCCAT CGGACATCCG ATCGGCGCGT CCGGAGCCCG CGTGCTGAAC 
ACGCTTCTTT TTGAAATGAA GCGGCGCAAC GTCTCGAAGG GCCTTGCGAC ACTCTGCATC 
GGCGGCGGCA TGGGGGTCGC CATGTGCGTG GAACGCCTTT AG

Protein sequence

MSNPSIVIAS AARTAVGSFN GAFGNTPAHE LGAAAVKAVL ERAGVEAGEV DEVILGQVLP 
AGEGQNPARQ AAMKAGVPQE KTAWGMNQLC GSGLRAVALG MQQIATGDAK VIVAGGMESM 
SMAPHCAHLR GGVKMGDYKM IDTMIKDGLT DAFYGYHMGT TAENVARKWQ LTREEQDEFA 
LASQNKAEAA QKAGRFADEI VPFVVKTRKG DVTVDQDEYI RHGATLESIA KLRPAFDKEG 
TVTAANASGL NDGAAAALLM TEAEAGRRGI QPLARIVSWA TAGVDPQIMG TGPIPASRKA 
LEKAGWSVAE IELVEANEAF AAQACAVNKD LGWDPSIVNV NGGAIAIGHP IGASGARVLN 
TLLFEMKRRN VSKGLATLCI GGGMGVAMCV ERL