Gene Smed_5903 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5903
Symbol
ID	5320205
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	868905
End bp	869891
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	63%
IMG OID	640777598
Product	D-isomer specific 2-hydroxyacid dehydrogenase NAD-binding
Protein accession	YP_001314530
Protein GI	150377935
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0111] Phosphoglycerate dehydrogenase and related dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.22808
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGCCAA AGGTTCTGAT GACCGCAAAG ACGCTTGCTA CGCCGGGGCT GGCCCTGCTC 
GAGCAAGCCG GCTGCGCGGT CTCCTTTCTT AAGGAAGGCA CGGAAGCGGA ACTCGCAGAA 
AGTCTGCGGT CGACTCCCTT CGATGCCGTC ATCTCCCGCA CCTTGGCGCT ACCGGCAATG 
ATGATCGAGA CGGCACCTGC CCTGCGCGTC ATCTCCCGCC ACGGTGTCGG CTATAATAAT 
GTCGATATCG AAAGCGCCAC CCGGCGCGGA GTGCCGGTGC TGATTGCCGA TGGCGCGAAT 
GGCAAATCGG TCGCCGAACT TGCCGTCGGC CTCGCCCTTT CGGTGGCCCG CAAAATCACG 
ACGCAAGACG CCTCGATTCG CGCCCGCCAG TGGAATCGCT CTGCCTACGG CCTGCAATTT 
GCCGGCAAGA CGGCAGGGAT CGTCGCCTTC GGTGCGATCG GCCGGCGGGT AGCGGAAATT 
CTGAGGGCAA TGGACATGCG GATCATCGCC TTCGACCCCC ATGCGCGCGA CCGTTCCACG 
ACCGGGGTCG ATTGGACCGA GACGCTGGAC GAACTCCTGC AGGAAAGCGA TCTCGTTTCG 
CTTCATTGCC CGTTGACGCC GGAGACCCGC AACATGATCA CCGCGCCGCG GCTGGCGCGG 
ATGAAGCCGG GCGCAATCCT GATCAATACC GCGCGTGGCG GCCTGATCGA CGAAAAGGCA 
TTGGCCGAGG CCGTTCTTTC CGGACATCTT GCCGGTGCAG GTCTCGACAC CTTCGCCGAT 
GAACCCCTCC CCGCCGACCA TCCGTTCCTT TCTCTGCCGC AGATCGTGAT GACTCCGCAT 
ATGGGCGGAA GCACCGACGT CGCGCTTGAT GGCGTTGCGA TCAGCGCAGC GCGCAACGTG 
CTCGACGTCC TGATCGACGG CAAGGTCGAT CGCCGTCTTC TCGTCAACCC GGCGGTTCTC 
GAACACCGCA CCGTCGAAGC AAAGTGA

Protein sequence

MGPKVLMTAK TLATPGLALL EQAGCAVSFL KEGTEAELAE SLRSTPFDAV ISRTLALPAM 
MIETAPALRV ISRHGVGYNN VDIESATRRG VPVLIADGAN GKSVAELAVG LALSVARKIT 
TQDASIRARQ WNRSAYGLQF AGKTAGIVAF GAIGRRVAEI LRAMDMRIIA FDPHARDRST 
TGVDWTETLD ELLQESDLVS LHCPLTPETR NMITAPRLAR MKPGAILINT ARGGLIDEKA 
LAEAVLSGHL AGAGLDTFAD EPLPADHPFL SLPQIVMTPH MGGSTDVALD GVAISAARNV 
LDVLIDGKVD RRLLVNPAVL EHRTVEAK