Gene Smed_0849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0849
Symbol
ID	5321687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	906704
End bp	907738
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	61%
IMG OID	640789786
Product	alcohol dehydrogenase
Protein accession	YP_001326539
Protein GI	150396072
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0438742
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAGAG CACTCGTCCT AGAGCAAATC CGGAAACTCT CGCTGCGCGA TATCGACCTG 
CCGCAGGAAG TCGGACCCCA CGACGTCCGC ATCAAGATTC ACACGGTCGG GATATGCGGG 
TCGGACGTGC ATTATTACAC GCACGGCCGG ATAGGGCCTT TTGTGGTGAA TGCGCCGATG 
GTACTCGGGC ATGAGGCGGC TGGCGTCGTC GTCGAAACCG GTAAGGACGT GACGCATCTC 
AAGGCAGGGG ATCGCGTGTG CATGGAGCCC GGAATTCCGG ACGCGAATTC GCGCGCCAGT 
CGTCTTGGCC TTTACAATAT CGACCCGGCT GTGACGTTTT GGGCGACGCC TCCTGTCCAT 
GGCGTCCTGA CTCCGCACGT CGTCCACTCG GCGAATTACA CCTATAAGCT GCCGGACAAA 
GTCAGTTTCG CAGAAGGGGC GATGGTGGAG CCGTTTGCCG TCGGCATGCA GGCGGCGCAA 
AAGGCGAAGA TTGCTCCCGG CGATACTGCC GTGGTCACCG GCGCCGGGCC GATCGGCATC 
ATGGTGGCGA TCGCGGCGCT CGCCGGAGGG TGCGCGCGGG TGATTGTTGC CGATTTCGCG 
CAACCGAAGC TAGACATTGC GGCGCAATAC CAGGGCATCC TGCCGATCAA CATCGGCAAA 
CGCGACCTCG CGGAGGAAGT GAAGCAGCTC ACCGAGGGCT GGGGCGCCGA TGTGGTGTTC 
GAATGCTCAG GTTCGCCGAA GGCATGGGAG ACATTGCTCG ATCTTCCCCG GCCAGGCGGT 
GCCGTCGTTG CTGTGGGACT CCCGGTCGAA CCGGTTGGTC TGGATATATC CACCGCATCG 
ACGAAGGAAA TCCGGTTTGA GACGGTATTT CGCTATGCCC ATCAATATGA CCGCGCAATC 
GCTTTGATGG GATCTGGGCG CGTCGACCTG AAGCCGCTCA TCACCGAGAC GTTTCCGTTC 
GAAGAAAGTG TCGCGGCTTT CGATCGCGCG GCGGAGGGTA GGCCGGGTGA TGTGAAGCTG 
CAGATCACGC TGTAG

Protein sequence

MPRALVLEQI RKLSLRDIDL PQEVGPHDVR IKIHTVGICG SDVHYYTHGR IGPFVVNAPM 
VLGHEAAGVV VETGKDVTHL KAGDRVCMEP GIPDANSRAS RLGLYNIDPA VTFWATPPVH 
GVLTPHVVHS ANYTYKLPDK VSFAEGAMVE PFAVGMQAAQ KAKIAPGDTA VVTGAGPIGI 
MVAIAALAGG CARVIVADFA QPKLDIAAQY QGILPINIGK RDLAEEVKQL TEGWGADVVF 
ECSGSPKAWE TLLDLPRPGG AVVAVGLPVE PVGLDISTAS TKEIRFETVF RYAHQYDRAI 
ALMGSGRVDL KPLITETFPF EESVAAFDRA AEGRPGDVKL QITL