Gene Rleg2_6113 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_6113
Symbol
ID	6983186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011370
Strand	-
Start bp	40250
End bp	41650
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	60%
IMG OID	643399136
Product	Aldehyde Dehydrogenase
Protein accession	YP_002283892
Protein GI	209551976
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.401659
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.835317
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGATA TTATTGAGAT CTTTTCTCCG TTCGATACGA GCCGGATTGG ACAGGTGGCA 
GCGGCAAGTC CAGTTGAGAT CGAGCGAGCA CTTGAAACAG CCTACGCGCT GTTCCGCGAC 
CGTCGCCAGT GGCTATCCAA GCAGAAACGG ATTGAAATTC TCAAGCGCGC GGCAGCGATT 
ATTACCCAGA GGCGCGAGGA ACTTGCTCGC CAAGCTGCGT CCGAGGGCGG GAAACCGCTA 
CGCGACTCCC TTATCGAGGT CGATCGCGGT GTCGATGGCA TCCATACCTG CGTCGAGGAA 
CTGCGGACCA AAGCCGGGCA AGTCGTGCCG ATGGACCTCA ACGCCACGTC TGCCGGGCGT 
GTGGCGTTCA CCCAATACGA GCCGATCGGC GTTGTGGTCG GCGTCAGTGC GTTCAACCAT 
CCCTTCAATC TGGTTGTGCA TCAGCTCGCC CCCGCGGTCG CCGTCGGCGC TCCCGTAATC 
CTTAAGCCCG CGACGACGAC ACCTCTCTCC TGCAGGTCGC TTGTTGAAAT ATTCCGCGAA 
GCTGGTCTGC CCGAGGGTTG GGCCCAGATG GTGGTACCCG AGACGAACGA GCTTGCGACC 
CGCTTGGTAA CGGATCCACG CGTCGGGTTC TTCTCGTTCA TTGGTTCGGC GGCGGTGGGA 
TGGTCCTTGC GCTCGAAGAT CGCTCCCGGG ACCAGGTGCG CACTCGAACA TGGCGGCGTC 
GCTCCCGTCA TCGTGTCTCA CGATGCCGAT TTGGATATGG CGATGCCCAA GGTGGCGCGG 
GGCGCTTTCT GGCATGCCGG CCAGGCATGT GTCGGTGTCC AGCGGGTATT CTGCCACAAC 
AGCGTTGTCG ACGACGTGGC GGAGCGACTG GGCGCGCTGG GAGAGAGAAT GGTGATCGGA 
GATCCTCTGT CGATGGCGAC CGAAGTAGGC CCACTGATTT CGCGAAAAGA GCTGGAGCGC 
GTTGGCCGAT GGGTCGACGA CGCGGCAAGC GGAGGGGCCA AGCTTATTTC AGGCGGGAAA 
AGGATTTCCG AAAGCTGCTA TTCCAATACG GTTCTTCTCA ATCCCCGACC CGATTCCGAT 
GTCATGCTCA AGGAGGTGTT TGGGCCTGTC GTCTGCGTGT ACGGCTACGA CGACATCGAT 
TCAGCCATCT CGCTTTCCAA TAGCCTGCCG TATTCATTCC AGGCGGCGGT CTTCACGAGC 
AGGCTCGACA CCGCGATGCA CTGCTACCGG CACCTCGACG GCACCGCGAT AATGGTCAAC 
GAGAACACGC TCTTCCGCGT CGACTGGATG CCGTTTTCCG GTGCTCGGCA ATCCGGACAC 
GGTGTCGGCG GGATGCCCTA CACCATGCAT GAAATGCAGA CGGAAAAGAT GATGGTCTGG 
CGCTCCGACG CGCTCGCCTA G

Protein sequence

MADIIEIFSP FDTSRIGQVA AASPVEIERA LETAYALFRD RRQWLSKQKR IEILKRAAAI 
ITQRREELAR QAASEGGKPL RDSLIEVDRG VDGIHTCVEE LRTKAGQVVP MDLNATSAGR 
VAFTQYEPIG VVVGVSAFNH PFNLVVHQLA PAVAVGAPVI LKPATTTPLS CRSLVEIFRE 
AGLPEGWAQM VVPETNELAT RLVTDPRVGF FSFIGSAAVG WSLRSKIAPG TRCALEHGGV 
APVIVSHDAD LDMAMPKVAR GAFWHAGQAC VGVQRVFCHN SVVDDVAERL GALGERMVIG 
DPLSMATEVG PLISRKELER VGRWVDDAAS GGAKLISGGK RISESCYSNT VLLNPRPDSD 
VMLKEVFGPV VCVYGYDDID SAISLSNSLP YSFQAAVFTS RLDTAMHCYR HLDGTAIMVN 
ENTLFRVDWM PFSGARQSGH GVGGMPYTMH EMQTEKMMVW RSDALA