Gene Rleg_5216 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5216
Symbol
ID	8007111
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	-
Start bp	627560
End bp	628708
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	64%
IMG OID	644822125
Product	oxidoreductase domain protein
Protein accession	YP_002973385
Protein GI	241113550
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.647839
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.501993
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACAGA CCAATGGTAT GAAACTCAGG ATCGGCATTG TCGGATGCGG CAACATTTCG 
CTCGCCTATA TGCGCAACGC GCCGCTGTTT CGCGGCGTCG AAATCATCGC CTGTGCAGAC 
CTCAACGCAG ACGCCGCCAA GCGCCGCGCA GCGGAGTTCG ATCTGCGCGC GGCTGACGTC 
GACAGCCTCA TCGACGACAG GAACATCGAC CTCATCCTCA ATCTGACGAT CCCGGCTGCG 
CATTTTGACG TTTCGATGCG GGCGCTGTCT GCAGGCAAGC ATGTCTTCAC GGAGAAGCCG 
CTCGGTGTCA CGGCCGCCGA AGGACGCCGG TTGGTGGATG CCGCCGCCGT AAAGGGCCTC 
ATGCTCGGCT CGGCGCCAGA CACTTTTCTG GGGGCGGCCG GACGCCATGC CCGGCGGCAG 
ATGGAAGCCG GCGCCATCGG CAAGCCGGTG ACCGGGACAG CCTTCATGAT GGGGCGCGGC 
ATGGAGCACT GGCATCCGGA TCCCGGCTTT TATTACCAGG CCGGCGCCGG CCCGGTCATG 
GATATGGGGC CTTATTATCT GACGATGATG GTCAATCTGA TGGGGCCTAT CCGCCGTGTG 
CAGGCCGTCG CCACAAGCGG GCAGGACGAG CGGCTCATCA CGGCGGAGGG CCCGAAGCAG 
GGCACCACGT TCAAGGTCGG CACGCCGACC AGCGTGCTGT CGTTGCTGGA ATTCGATTGC 
GGTGCCAAGG TCACCTTCGG CGCCTCCTGG GACGTCTTTC GCCACTCCAA TCACCCCATC 
GAACTCCACG GGACCGAAGG CTCGCTGCGC CTGCCTGACC CCGACAATTT CGGCGGCTCC 
GTTGCGCTCT CCAGTCGCGG CGCGCCCTGG CAGGAAACGG ATACGTCAGG CAAACTCTTC 
GGCGCCGTCA ACTGGCCGAT CGCAGCGCCT GATCGTGCCA ACTACCGCAT GCTTGGTCTT 
GCCGATCTCG CACGCGCAAT CATTGAGGGC CGTGCGCCGC GTGCTTCGGG CGATCTCGCT 
CTCCATGTGC TCGAAGTCAT GGAAGCGATC CTGCGTGCCG GTGAAGCCGG TGTCGCGCAG 
ACCATTCCGG GTATTGTCGC GCAGCCAAAA GAATTGCGGG AAGACGAAGC GAGGAGTTTG 
CTGGCATGA

Protein sequence

MAQTNGMKLR IGIVGCGNIS LAYMRNAPLF RGVEIIACAD LNADAAKRRA AEFDLRAADV 
DSLIDDRNID LILNLTIPAA HFDVSMRALS AGKHVFTEKP LGVTAAEGRR LVDAAAVKGL 
MLGSAPDTFL GAAGRHARRQ MEAGAIGKPV TGTAFMMGRG MEHWHPDPGF YYQAGAGPVM 
DMGPYYLTMM VNLMGPIRRV QAVATSGQDE RLITAEGPKQ GTTFKVGTPT SVLSLLEFDC 
GAKVTFGASW DVFRHSNHPI ELHGTEGSLR LPDPDNFGGS VALSSRGAPW QETDTSGKLF 
GAVNWPIAAP DRANYRMLGL ADLARAIIEG RAPRASGDLA LHVLEVMEAI LRAGEAGVAQ 
TIPGIVAQPK ELREDEARSL LA