Gene Rleg_3068 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_3068
Symbol
ID	8013979
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	3064462
End bp	3065442
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	66%
IMG OID	644825636
Product	Alcohol dehydrogenase zinc-binding domain protein
Protein accession	YP_002976864
Protein GI	241205768
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0181294
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.830882
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCCG TCCAATTCAA TCGCTTCGGT CCGCCAGATG TCCTCGAGCT CGTGGAACTG 
CCGGTCCCCG AGCCGGGACC GGACGAGGTG CTTGTCCGCG TCCACGCGGC GGGCGTCAAC 
TTCTTCGAGG TGTTGATGCG GGCCGACCGC TATGCCGTGA CGCCCGACCT GCCGATGTTT 
CCCGGTGTCG AGGTCGCGGG TACGATCGAG CGAGCAGGGC CTGGTGCCGA CCGCTCGCTC 
ATTGGTACGC GCGTTGCCGT TCCTCTCTTT GCGATGGGGC GCGGTTCGGG CGGTTATGCC 
GAGTTCGTTG CGGTCGATGG CGGGGCGGTG GTGCAACTGC CCGGTGCGGT TTCTTTCGAG 
GCGGCCGCCG CGCTGATGGT GCAGGGGTTG ACGGCGCTGC ACCTCCTACG CCGCAGTCCA 
GTGAAAGGCA AAAACGTTCT CGTCAATGCG GCAGCCGGCG GTGTCGGTTC GCTCCTCCTG 
CAGCTGGCGA GGCGCGACGG GACGAAGATG GTGATCGCGG CGGCGAGCAG TGACGAGAAG 
AGGGCGCTTT CCCTGTCGCT TGGCGCCGAT CATGCGGTCG ATTATACGGC GCCCGGCTGG 
CAGGAGGATG TCAAGAGGGT GACCGGAGGG CCCGGCGCGG ATGTCATCTA TGAAACCGTC 
GGCGGCGCGT TTTCAAGGGC GGCGCTCGAT GCGCTGGCGC CTTGCGGGGA ACTGGTGCTG 
GCGGCGATGG GGCGGTTCGG GCTCGGGGCC GCAGATGTCG AGGGCATGCT TGATCACAAC 
CAGTCGATCA AGGGATTTTC GTTGTTGGCG CTGCTGACGC CTCAGGGGGT GCGTGAGGAT 
CTTGCAGCGC TCTTCGAGCT TGCCGCGACG GGCGCCCTGA CGGTTATCGA CGGCGGTCGT 
TTCCCACTGC ATCAAGCGGC GGAAGCGCAT CGCGCCATCG AAGATCGGCG GGCGGTCGGC 
AAGGTGGTGC TGGTGCCTTA G

Protein sequence

MKAVQFNRFG PPDVLELVEL PVPEPGPDEV LVRVHAAGVN FFEVLMRADR YAVTPDLPMF 
PGVEVAGTIE RAGPGADRSL IGTRVAVPLF AMGRGSGGYA EFVAVDGGAV VQLPGAVSFE 
AAAALMVQGL TALHLLRRSP VKGKNVLVNA AAGGVGSLLL QLARRDGTKM VIAAASSDEK 
RALSLSLGAD HAVDYTAPGW QEDVKRVTGG PGADVIYETV GGAFSRAALD ALAPCGELVL 
AAMGRFGLGA ADVEGMLDHN QSIKGFSLLA LLTPQGVRED LAALFELAAT GALTVIDGGR 
FPLHQAAEAH RAIEDRRAVG KVVLVP