Gene Smed_3489 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3489
Symbol
ID	5324377
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	3696726
End bp	3697721
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	63%
IMG OID	640792441
Product	aldo/keto reductase
Protein accession	YP_001329142
Protein GI	150398675
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATACC GCAAGCTTGG CAACGAACTC ACCGTTTCGA CCGTCGGCCT CGGTTGCATG 
GGAATGAGCT TCGCCTATGG CGAAGCAGAC GAAAACCAAT CGATCCGCAC GCTTCATCGC 
GCCGTTGAAC TCGGCGTCAA CTTCTTCGAC ACGGCGGAGG TCTACGGCCC CTACGAGAAC 
GAGAAGCTGA TCGGCAAAGC GCTGAAAGAC CGGCGCGATC AGGTCGTAAT CGCCACCAAA 
TTCGGCTTTC GAATCGAACC GGGCAAGCCC GCCACTCGAG CGATCAGGGG CGTCGACGGC 
CGGCCGGAAA ATGCGAAAGC CGTTGCAGAG GCATCCCTTG GGAGACTCGG CATCGATATC 
ATCGATCTCT ATTACCAACA CCGCGTCGAC CCGGCCGTAC CGATCGAGGA AACGGTCGGC 
GCAATGGCCG AGCTGGTGAA AGAAGGCAAG GTGCGCGCCC TCGGACTTTC CGAGGCGAGC 
GCCGCCACCA TCCGCCGCGC CCATTCCGTG CACCCGATCG CGGCCGTACA GAGCGAGTAC 
TCACTCTGGT CGCGTGATCC GGAACAGGAG GTTCTCGCCA CCTGCCGCGA GCTCGGCATC 
GGCTTCGTTC CTTACAGCCC GCTGGGGCGC GGCATGCTGA CGGGTGCGAT CCGCAGGCTC 
GAGGATCTCG CTGCCGACGA TTTCCGGCGA TCTCTGCCGC GCTTTCAGCA GGAGAATTTC 
GAGGCCAATG CGGCGCTAAT CGGCACGCTC GAAAGGCTCG CCTCGGCAAG AGAGGTGACC 
GCTGCCCAGC TTGCACTCGC CTGGGTCGTC AATCAGGGCG AGGACATCGT GCCGATTCCC 
GGGGCGCGCA GGATCGAGCA TCTGGAGCAG AACGTGGCCG CCGCCGGGAT CGTCCTCACA 
GAAGGCGAAC GCGCAGAAAT CGGCGAAGCG CTTTCTCCGG AACGCGTCGC CGGCCGACGC 
TACACGGACG CATCGCTTGC CCTGACGAAC AGGTAA

Protein sequence

MKYRKLGNEL TVSTVGLGCM GMSFAYGEAD ENQSIRTLHR AVELGVNFFD TAEVYGPYEN 
EKLIGKALKD RRDQVVIATK FGFRIEPGKP ATRAIRGVDG RPENAKAVAE ASLGRLGIDI 
IDLYYQHRVD PAVPIEETVG AMAELVKEGK VRALGLSEAS AATIRRAHSV HPIAAVQSEY 
SLWSRDPEQE VLATCRELGI GFVPYSPLGR GMLTGAIRRL EDLAADDFRR SLPRFQQENF 
EANAALIGTL ERLASAREVT AAQLALAWVV NQGEDIVPIP GARRIEHLEQ NVAAAGIVLT 
EGERAEIGEA LSPERVAGRR YTDASLALTN R