Gene Rleg_4733 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4733
Symbol
ID	8007469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	-
Start bp	100879
End bp	101847
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	63%
IMG OID	644821664
Product	Alcohol dehydrogenase GroES domain protein
Protein accession	YP_002972924
Protein GI	241113089
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATATC AGGCGGTCGT GCGAAAATTC GGCCCGGCTC AGGATGTCGT CGAGCTCGAG 
CAGGCTGCGC TGCCGCCGCT GGCGCGCGAC CAGGTGAGGG TGCGCCTGCT GGCGCGGGCG 
ATCAATCCGT CCGATATCAT CACCATCTCG GGAGCCTATA GCGGACGCAC GACATTGCCT 
TTCGTTCCCG GCTTCGAAGC GTTCGGCGTG GTCGAACAAT GCGGTGAAGA GGTTCATGGG 
CTTTCGCCGG GAACACGCGT GCTGCCGGTG CGTAGCGCCG GCGGCTGGCA GGAATTCAAG 
GATACCGATC CCGGCTGGTG CCTGCGTGTT CCTGACGAGC TCACCGACTT CGAAGCTGCG 
ACGAGCTACG TCAATCCGAT GACGGCCTGG TTGATGCTGC ATGCCAAGAT CGGGCTGAGG 
CCGGGCATGC GCATCGCTAT CAATGCCGCC GCCTCTTCGA TCGGAGCGAT ATTGATCGGT 
CTCGCCAACG CCGCAGGCGT GGAGCCGGTC GCCATCGTCC GTAGCGAGGG ATCGCTTGAG 
CGCCTGCGCG GCCGGGTCGA GGCTATCATC ATCGATAGAG AGGAAAGCGA TCTGGTTGCC 
GGGCTTGCCG GCCGACACGG GCTAGACGCG GTGCTCGATT GCGTCGGAGG AGCGCGCGCC 
ACAATCCTCG CCGATGCGCT GCGGGCGGGC GGACGCTTCT TGCACTACGG TCTGCTCTCT 
GGGCAGAGCA TCCCGAACTC ATTCTGGGCG ACCCATCCCG ATATTTCCTT TTCCTATGTT 
CACCTCCGGG AATGGGTTCA TTCCGAAGCT ATGGACGACG TGCAGCACGC CTATTCCAAG 
GTCGCGGCGC ACATCGTTTC GAAGGTCATC GAGACCGAGA TCCGGGAGGT GTTTCCTTTG 
GAAAGTGTCC GGCAAGCCCT GCAGTCCGCT CTTCCCTTCC GAACGGGCGG CAAGGTTCTG 
CTCGCCTGA

Protein sequence

MQYQAVVRKF GPAQDVVELE QAALPPLARD QVRVRLLARA INPSDIITIS GAYSGRTTLP 
FVPGFEAFGV VEQCGEEVHG LSPGTRVLPV RSAGGWQEFK DTDPGWCLRV PDELTDFEAA 
TSYVNPMTAW LMLHAKIGLR PGMRIAINAA ASSIGAILIG LANAAGVEPV AIVRSEGSLE 
RLRGRVEAII IDREESDLVA GLAGRHGLDA VLDCVGGARA TILADALRAG GRFLHYGLLS 
GQSIPNSFWA THPDISFSYV HLREWVHSEA MDDVQHAYSK VAAHIVSKVI ETEIREVFPL 
ESVRQALQSA LPFRTGGKVL LA