Gene Rleg2_4679 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4679
Symbol
ID	6977773
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	+
Start bp	317235
End bp	318203
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	65%
IMG OID	643393853
Product	Alcohol dehydrogenase GroES domain protein
Protein accession	YP_002278671
Protein GI	209546753
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.599367
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.999229
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATATC AGGCGGTGGT GCGAAAATTC GGACCGGCTC AGGATGTCGT CGGGATCGAG 
CGGGCTGCAT TGCCGGCGCT GCGCCGCGAC CAGGTGCGCG TGCGCCTCTT GGCGCGATCG 
ATCAATCCCT CCGATATCAT CACCATATCA GGCGCCTATG CCGGACGCAC GACCCTGCCC 
TTCATCCCCG GCTTCGAAGC CTTCGGGGTG GTCGACGCTT GCGGTGAAGA CGTTTACGGG 
CTTATGCCCG GCAGGCGCGT GCTGCCGGTG CGCAGCGCCG GCGGATGGCA GGAATTCAAG 
GATACCGATC CCAGCTGGTG CCTTCGTGTT CCGGAGGTGC TGTCCGATTT CGAAGCGGCG 
ACCAGCTACG TCAACCCGAT GACCGCCTGG CTGATGCTGC ACAAGAAGAT CGGGCTGAGG 
CCCGGCATGC GCATCGCCGT CAATGCCGCC GCCTCTTCGA TCGGATCGAT CCTGATCGGC 
CTTGCCAATG CCGCGGGCGT CGAGCCGGTC GCAATCGTTC GCAGCGAGGA ATCGCGCGCA 
CGCCTCAGCG GCCGTCTCGA GGCCGTCATC GTCGATGGTG CGGACGGCGA TCTGGCCGCC 
GGGCTTGCCG GCCGGCATGG GCTGGACGCG GTGCTCGACT GCGTCGGCGG TGCGCGTGCC 
TCAATCCTCG CTGCTGCGCT CAAGCCAGGC GGACACTTCG TGCATTACGG CCTGCTCTCC 
GGCCAAAGCA TCCCGAATTC CTTCTGGGCC GCCCATCCCG ATATCACCTT CTCCTTTTTC 
CATCTCCGGA AATGGGTTCA TTCCGAAGAC ATGGACCATG TCCAGCGCGC CTATTCCGAA 
GTGGCGGCGC AAATCGCTGC GAAGGTGGTC GCGACCGAGG TGCGGGAAGT CTTTCCTATG 
GAAAAGATCG GCGAAGCGCT GCGCTCCGCC CTTCCCTTCC GGGCGGGCGG CAAGGTGCTG 
CTCGCCTGA

Protein sequence

MQYQAVVRKF GPAQDVVGIE RAALPALRRD QVRVRLLARS INPSDIITIS GAYAGRTTLP 
FIPGFEAFGV VDACGEDVYG LMPGRRVLPV RSAGGWQEFK DTDPSWCLRV PEVLSDFEAA 
TSYVNPMTAW LMLHKKIGLR PGMRIAVNAA ASSIGSILIG LANAAGVEPV AIVRSEESRA 
RLSGRLEAVI VDGADGDLAA GLAGRHGLDA VLDCVGGARA SILAAALKPG GHFVHYGLLS 
GQSIPNSFWA AHPDITFSFF HLRKWVHSED MDHVQRAYSE VAAQIAAKVV ATEVREVFPM 
EKIGEALRSA LPFRAGGKVL LA