Gene Smed_1954 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1954
Symbol
ID	5322813
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	2005887
End bp	2006936
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	64%
IMG OID	640790892
Product	aldo/keto reductase
Protein accession	YP_001327623
Protein GI	150397156
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.464115
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0603236
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATATC GTCAGCTCGG CCGATCCGGC CTCAAGATCT CGACCATCAC CATGGGCACG 
ATGACGATCG GCGGTGGCGG CAAGTTCGCC CAGGTCGGCG ACGTCGGTGT CGCGGATGCC 
AGCCGCCATG TCGACCTCTG CCTGGATGCC GGCGTCAACC TCATCGATAC GGCCGACATC 
TATTCAACCG GCGTCTGCGA GGAGATTATC GGCGAGGTTC TTGGCGGAAA GCGCAAGGAC 
GGCGTGCTGA TCGCCACAAA AGCACGCTTC TCCATGGGGC CGGGTCCGAA CGACGGCGGC 
CTTTCGCGCC ACCACCTGAT CAGTGCCTGC GAGGCGAGCC TCAAGCGCTT GAAGACCGAT 
GTGATCGACC TATACCAGGT GCATGAATGG GACGGCCAGA CGCCGCTCGA GGAAACGATG 
GAAGCGCTCG ATACACTCGT GCGGCAGGGC AAAGTTCGCT ATATCGGCTG CTCCAACTAT 
TCGGGCTGGC ATATAATGAA GGCCCTCGGC GTCAGCGCCC TCGATAAACG CCAGCGTTTC 
GTCAGCCAGC AGATTCACTA CACGCTGGAA GCCCGCGAGG CCGAGTACGA GCTGGTCCCG 
ATTTCGATCG ATCAGGGCCT TGGCATTCTC GTCTGGAGCC CGCTCGCCGG CGGCCTTCTT 
TCAGGAAAGC ACAGGCGTGG CCAGTCGCCG GAAGGCACAC GCCAGCTCGC CGGCTGGAAC 
GAGCCGCCGA TCCGCGACGA GGAACGGCTG TGGAAAATCG TCGACATCCT GGTGGCGATC 
GCGGCCGAAC GCGGCGTGTC ACCGGCGCAG GTCGCCCTCG CCTGGCTGAT CGGCCGCCAG 
GCCGTCACCT CCGTCATCAT CGGTGGTCGA ACCGAGCAAC AGTTCCGCGA CAATCTCGCC 
GCCGCCGGCC TGAGGCTCAC CGAAGAGGAA CGCGAGCTCC TCGAGGCCGT AAGCCGGCCG 
CCGGTCATCT ATCCGTACTG GCATCAGCTC TGGACCGCAA AGGACCGGCT CGGCAAAGCC 
GACCTCTCGC TTCTCGGACC GCATGTGTGA

Protein sequence

MEYRQLGRSG LKISTITMGT MTIGGGGKFA QVGDVGVADA SRHVDLCLDA GVNLIDTADI 
YSTGVCEEII GEVLGGKRKD GVLIATKARF SMGPGPNDGG LSRHHLISAC EASLKRLKTD 
VIDLYQVHEW DGQTPLEETM EALDTLVRQG KVRYIGCSNY SGWHIMKALG VSALDKRQRF 
VSQQIHYTLE AREAEYELVP ISIDQGLGIL VWSPLAGGLL SGKHRRGQSP EGTRQLAGWN 
EPPIRDEERL WKIVDILVAI AAERGVSPAQ VALAWLIGRQ AVTSVIIGGR TEQQFRDNLA 
AAGLRLTEEE RELLEAVSRP PVIYPYWHQL WTAKDRLGKA DLSLLGPHV