Gene Rleg2_6236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_6236
Symbol
ID	6983309
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011370
Strand	-
Start bp	178617
End bp	179597
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	60%
IMG OID	643399248
Product	Alcohol dehydrogenase GroES domain protein
Protein accession	YP_002284004
Protein GI	209552088
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.547714
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.621953
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAAG ATATGGGCTT GAACCGATTG GGAAATCATA TGAAGCGTAT TCAATATCAT 
CGCTACGGCG GCCCTGATGT TATGCAGATG GAGCGGTTCG AACCGCCCGC ATTGCGACCT 
GACGATATCG CAGTGAAAGT GGTGTACGCG GCGATCAACC CGGTCGATTG GAAAGTCCGC 
AGGGGCGATT TGAAACTCGT CACAGGCCGC AAATTTCCTC GGGCGATGGG GTGTGATTTT 
TCGGGTGAGA TCCTTGCCGT GGGGTCCGGC GTCACGGCGT TCAAGCTGGG TGAGGCGGTA 
TTTGGCGTCG CTCCTGTTAA AACCTGCGGC GCGCTCGCCG AAGTCGTCGT CGCCCCGCAG 
ACGGTCGTAG GCCGAAAGCC GGAGAGCGTG ACATTCGAAG AAGCCGCATG TCTGGGTACT 
CCCGGCGTCA CCGCCTGGAA CGCCCTGATC GACAAGGCGC ATCTGAAAGC CGGACAGCAT 
GTGCTGATCA ATGGCTGCAC CGGCGCGGTG GGAGCCGCCG CCGTGCAGAT CGCCTTGCTT 
CAAGGTGCAA TTGTATCGGG GACATGCAGC GCTGATGCCG CAACCCAAGC CAAAGCACTT 
GGTGTCACGG AAGTCCTAGA TTATCGCAAA ACAAATCTGG CGACCTTGTC CCGCCGCTTC 
GACGTCGTCT TCGATACTGC TATCACGATG CCGATCGCGA CCGGATTGTG CTTGCTCAGC 
CGGGGAGGCG TGTTCCTCGA CCTTGAGCCC GGGCCAGCAA AGATCATCCG TTCTCTTTTC 
GACCGCCGGT TGAAGCCGAT CATCTGCACG CCGCGCCCTG CCATCATGGC AGCGTTGGCG 
GAAGCCGCGA GAGTGGGCCG TCTGTCTGTG CCGAGCGCCC AGATCGTCGA TTTCGATGCC 
GCGATCGGCA AGATTGCGAA CCTAGAACAG GGTGTCGGCT CGCGAGGGAA GGCCGTTGTC 
GCGATCGGTA CGGCCGTTTA G

Protein sequence

MTEDMGLNRL GNHMKRIQYH RYGGPDVMQM ERFEPPALRP DDIAVKVVYA AINPVDWKVR 
RGDLKLVTGR KFPRAMGCDF SGEILAVGSG VTAFKLGEAV FGVAPVKTCG ALAEVVVAPQ 
TVVGRKPESV TFEEAACLGT PGVTAWNALI DKAHLKAGQH VLINGCTGAV GAAAVQIALL 
QGAIVSGTCS ADAATQAKAL GVTEVLDYRK TNLATLSRRF DVVFDTAITM PIATGLCLLS 
RGGVFLDLEP GPAKIIRSLF DRRLKPIICT PRPAIMAALA EAARVGRLSV PSAQIVDFDA 
AIGKIANLEQ GVGSRGKAVV AIGTAV