Gene Smed_5081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5081
Symbol
ID	5319383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	28956
End bp	29861
Gene Length	906 bp
Protein Length	301 aa
Translation table	11
GC content	63%
IMG OID	640776861
Product	5-dehydro-4-deoxyglucarate dehydratase
Protein accession	YP_001313793
Protein GI	150377198
COG category	[E] Amino acid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0329] Dihydrodipicolinate synthase/N-acetylneuraminate lyase
TIGRFAM ID	[TIGR03249] 5-dehydro-4-deoxyglucarate dehydratase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.302501
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTCGCCTG AAGAAATCAA GTCGCGTGTC GGTTCGGGGC TCTTGTCCTT TCCGGTCACG 
CACTTCACGT CGGATTACAA GCTCAATCTC GAAAGCTACC GGCGTCATGT GGAGTGGCTT 
TCGGGCTTCG GGGCCGCGGC CCTGTTTGCC GCCGGCGGCA CCGGCGAGTT CTTTTCGCTC 
TCGCCGGATG AAGTGGGTGA GGTCACCCGT GCGGCGAAGG ACGTATCGGG CGAGGTGCCG 
ATCATTGCGG GTTGCGGCTA TGGCACGTCC CTTGCGGTCG AGACGGCGAA AATAGTCGAG 
GCGGCGGGCG CCGACGGCAT TCTCCTGCTG CCGCACTATC TCACCGAAGC GCCGCAGGAA 
GGCATCTACG CTCATGTGAA GGCCGTATGC GATTCAACAG GTCTCGGGGT CATTCTCTAC 
AACCGCGCCA ATTCCATCGC GAATGCCGAC ACGGTTGCGC GCCTGGCTGA GGCCTGCCCC 
AACCTGATCG GCTTCAAGGA CGGTACCGGC AAAGTCGACC TCGTGCGCCA CGTGACGGCC 
AAGCTCGGCG ACCGGCTCTG CTACATAGGC GGAATGCCGA CCCACGAGCT CTTCGCAGAA 
GGCTTCAACG GCGTCGGCGT TACCACCTAT TCGTCGGCGG TGTTCAATTT CGTGCCGGAG 
CTGGCACAGC GCTTCTATCG GGCAATGCGG GCCGGCGACA AGGCGGTGAT GGAAGGGATC 
CTTCAGACGT TCTTTTTCCC GTTTGCAGCC CTGCGCGACC GCAAGGCCGG TTATCCGGTC 
TCCATCATCA AGGCGGGCGT GGAGCTTGCC GGCTTTGCGC CCGGCCCGGT GCGCCCGCCC 
CTGGTCGATC TGACCGGCGA AGAGCGGGAG ATATTGCAGG GGCTGATAGA AGCGTCGCGC 
AACTGA

Protein sequence

MSPEEIKSRV GSGLLSFPVT HFTSDYKLNL ESYRRHVEWL SGFGAAALFA AGGTGEFFSL 
SPDEVGEVTR AAKDVSGEVP IIAGCGYGTS LAVETAKIVE AAGADGILLL PHYLTEAPQE 
GIYAHVKAVC DSTGLGVILY NRANSIANAD TVARLAEACP NLIGFKDGTG KVDLVRHVTA 
KLGDRLCYIG GMPTHELFAE GFNGVGVTTY SSAVFNFVPE LAQRFYRAMR AGDKAVMEGI 
LQTFFFPFAA LRDRKAGYPV SIIKAGVELA GFAPGPVRPP LVDLTGEERE ILQGLIEASR 
N