Gene Smed_5297 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5297
Symbol
ID	5319599
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	259172
End bp	260125
Gene Length	954 bp
Protein Length	317 aa
Translation table	11
GC content	58%
IMG OID	640777072
Product	short chain dehydrogenase
Protein accession	YP_001314004
Protein GI	150377409
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.460339
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATCCG AAACAGGTCA GAAGCAGCGC GAAATCCAGA AGCAGGTCGA CGAGGCTGAC 
AAGCGGGAGA AGCCGAAGAC CTCGGGAGCC ATGCAGGCAG GCGCTCGCCG CTACCCAGAA 
CCGCCGTTTC CAAAGGTGCA TCAGGACAAG CCAGGCTCGG AGGCTGATCT TCCTGTCGCG 
CCAATGTATG ATGCCCCGTT TTACAAGGGC TCAGACAAGC TAAAGGACAA GGTAGCACTT 
ATCACAGGCG GTGACTCCGG CATCGGGCGG TCGGTTGCGG TCCTCTTTGC TCGCGAAGGG 
GCGGACGTCG CAATTGTTCA TCTCGACGAA GCTCAGGACG CAGAAGACAC AAAAGCTGCT 
GTTGAGAAGG AAGGACGCAA GTGCCTGGTG ATCAGAGGCG ACGTAAAGGA TGCGAGCTTC 
TGCCGGAAGG CAGTGGAAAA GACCGTTATG CAACTTGGCC GTCTCGACAT CCTCGTCAAC 
AATGCCGCCT TCCAGGTGCA CACGCAGGAT ATCCAGGACC TGACCGACGA GCACTTCGAC 
GAGACGCTGA AGACGAACCT CTATGGTTAC TTCTACATGG CAAAGGCGGC TATTCCTCAT 
TTGAAGAACG GCTCGGCAAT CATAAACACT GGATCAGTCA CCGGCCTTAC CGGTTCGAAG 
GAGCTTCTCG ACTACTCCAT GACCAAGGGG GGCATTCACG CCTTCACCCG CGCCCTTTCG 
GGACATCTCG TTCCTAAAGG TATCCGCGTG AACGCCGTCG CCCCGGGCCC CGTCTGGACG 
CCTCTCAATC CGTCAGACAA AGCGGCTGAA GATGTGGAGA AGTTCGGGTC CCAAACCCCG 
ATGAAGCGTG CTGCACAGCC TGAGGAAATT GCGCCGGCCT ACGTCTTTCT CGCCTCCCCG 
CAGATGTCGA GCTATATCAC CGGCGAGATC CTCCCGATCG TCGGCGGTTA CTGA

Protein sequence

MKSETGQKQR EIQKQVDEAD KREKPKTSGA MQAGARRYPE PPFPKVHQDK PGSEADLPVA 
PMYDAPFYKG SDKLKDKVAL ITGGDSGIGR SVAVLFAREG ADVAIVHLDE AQDAEDTKAA 
VEKEGRKCLV IRGDVKDASF CRKAVEKTVM QLGRLDILVN NAAFQVHTQD IQDLTDEHFD 
ETLKTNLYGY FYMAKAAIPH LKNGSAIINT GSVTGLTGSK ELLDYSMTKG GIHAFTRALS 
GHLVPKGIRV NAVAPGPVWT PLNPSDKAAE DVEKFGSQTP MKRAAQPEEI APAYVFLASP 
QMSSYITGEI LPIVGGY