Gene Rleg2_1620 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_1620
Symbol
ID	6980356
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	1646420
End bp	1647409
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	61%
IMG OID	643396345
Product	aldo/keto reductase
Protein accession	YP_002281136
Protein GI	209549219
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID	[TIGR01293] voltage-dependent potassium channel beta subunit, animal

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.884834
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.762073
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATATC GTCGTCTGGG AAAATCGGGT CTGCAAGTGA GCGAGTTCTC GTTCGGCTCA 
TGGGTGACAT TCGGTAAGCA GGTCAATGGC GGCGACGCCG TCGACCTCAT GAAGCTTGCC 
TATGACAACG GGGTGAACTT CTTCGACAAT GCCGAAGGAT ACGAAAGCGG CAAGTCCGAG 
ATCGTCATGG GCGAGGCGCT GAAGTCGCTT GGCTGGAGCC GCGACAGCTT CGTCGTCTCG 
AGCAAGGTCT TCTGGGGCGG CCAAAAGCCG ACGCAGCGCG GCCTGTCGCG CAAGCACGTG 
ACCGATGCCT GCCATGCCGC GCTGAAGAGA CTTCAGGTCG ATTACCTCGA CCTCTATTTC 
TGCCATCGCC CGGATATCGA CACGCCGATC GAGGAAACGG TCCGGGCGAT GCACGATCTC 
GTCGCCCAGG GCAAGGTGCT CTACTGGGGA ACGTCGGAAT GGTCGGCGCA ACAATTGACG 
GAAGCCTACG CCGTTGCCCG CGACCTGCGC ATCACGCCGC CGACGATGGA GCAGCCGCAG 
TACAATATCT TCGAACGTCA GAAGGTCGAA TCCGACTATC TCCCGCTCTA CGACCTGATC 
GGTCTCGGCA CCACGATCTG GTCGCCGCTC GCCTCGGGCG TCCTGACCGG CAAATATAAT 
AACGGTGTGC CGGCTGACAG CCGGATGAAC TTGCCGGGCT ACGAATGGCT GAAGGAGAAG 
TGGTCCAGCG ACGCCGGCCG CGCCCAGCTC AAGCAAGTGG GTGAACTTGC AAAGCTCGCC 
GATGAGATCG GCCTGTCGAT CACCCATCTT GCCCTGTTGT GGTGCCTCGC CAATCGCAAC 
GTCTCCACCG TCATTCTCGG CGCCTCGCGC GCCAGCCAGT TGCAGGACAA TCTCGCGGCC 
CTTTCGCACA GGCAGAAGAT GACCCCTGAA GTGATGGGCC GGATCGACAC CATCGTTGGA 
AACAAGCCGG AAGGCCCGCG TCGATTCTAA

Protein sequence

MEYRRLGKSG LQVSEFSFGS WVTFGKQVNG GDAVDLMKLA YDNGVNFFDN AEGYESGKSE 
IVMGEALKSL GWSRDSFVVS SKVFWGGQKP TQRGLSRKHV TDACHAALKR LQVDYLDLYF 
CHRPDIDTPI EETVRAMHDL VAQGKVLYWG TSEWSAQQLT EAYAVARDLR ITPPTMEQPQ 
YNIFERQKVE SDYLPLYDLI GLGTTIWSPL ASGVLTGKYN NGVPADSRMN LPGYEWLKEK 
WSSDAGRAQL KQVGELAKLA DEIGLSITHL ALLWCLANRN VSTVILGASR ASQLQDNLAA 
LSHRQKMTPE VMGRIDTIVG NKPEGPRRF