Gene Rleg2_5299 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5299
Symbol
ID	6978393
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	-
Start bp	926918
End bp	928342
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	62%
IMG OID	643394403
Product	Aldehyde Dehydrogenase
Protein accession	YP_002279221
Protein GI	209547303
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.103743
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAACG CCCACAAATT CTATATCGGC GGTGAGTGGG TCGATCCCGA AAGGCTGAGA 
GAGCTTCACG TGATCGATCC GTCGACCGAA CAATCCATCG GAACGATAGC GATCGGCAGT 
ACGGCCGATG CAGAGCGGGC GATCAAAGCC GCCCGCGCGG CCTTTCCGAT CTTCTCACAG 
ACGACGAAGG CGGAGCGGCG GGCGCTGCTT GAGCGAGTTC TGATGATCCT GAAGCGCCGT 
CAGCACGAGA TCGGCGACAT CATCTCCCGC GAAATGGGTG CCCCGCTGGC CATGGCACGG 
GCGGACCAAG CGGGGCTGGG TGCGGCGCAT TTCGAAGAGA CAATCCGGGC TTTCGATGCG 
TTCGACTTCG AATATCTGCA GGGCTCAACC CGGATCGTTC ACGAACCGAT CGGCGTCGTG 
AGCATGATCA CGCCATGGAA CTGGCCGATC AATCAGATTG CCTGCAAGGT GGCTCCGGCG 
CTGGCGACAG GCTGCACGAT GGTGCTCAAA CCGTCTGAGA TCGCGCCCTT CAACGCTCTC 
GTCTTTGCCG AAGTCATGCA TGAGGCGGGT GTCCCGAAAG GCGTCTTCAA CCTGGTTCAG 
GGTGACGGGC CGACTGTCGG CGCGGCGCTC GCCGGCCATC CCGATGTCGA TATGGTCTCG 
TTTACCGGAT CGACGCGGGC CGGGATCGCC GTCGCGCAGG CAGCGGCGCC GACCGTCAAG 
CGGGTGCATC AGGAACTCGG CGGAAAGTCG CCGAACATCC TATTGCGAAG CGCCGATCTT 
GGTTCGGCGG TCGCAGCCGG CCTGCGCCGG TGCTTCGCCA ATTCCGGACA GTCATGCAAT 
GCGCCGACCC GGATGCTGGT GCCGGCCGAG CGCATGGATG AAGCGAGTGC CATCGCAGCA 
AGGGCGGCAG CATCGCTGAC GGTCGGACCT CCTCATGACC CGGGCACTGA TCTTGGTCCG 
GTGGCGAGCG CTGCCCAATT CGCCAATATC CAGGCGCTGA TCGAGAAAGG CATTGCCGAG 
GGCGCCGAAT TGGTGGCCGG CGGTCCTGGG CGCCCATCCA ATCTGAACGC GGGCTATTAC 
GTGCGTCCAA CGGTATTTGC GTGCGTGAAG AATTCGATGA CCATCGCACG GGAGGAGATT 
TTTGGCCCCG TACTGTCGAT CATCGGCTAC GACACCGAGG CCGATGCTGT CGCGATCGCC 
AACGACACAC CTTACGGTCT CGCCGCCTAT ATCCAAGGCG ACCCGCAGGA GGCGCGGACG 
CTCGCCCGTC GGCTTCGCAC CGGCATCGTG CGCCTCAATC AATCTGCATG GGATAGCGCA 
GCCCCCTTCG GCGGCTATAA GCAGTCCGGC AATGGCCGCG AATACGGGAA GTTCGGATTG 
CAGGAATTCA CCGAGATCAA GGGCATTGTC GGGCACGCAG ATTAG

Protein sequence

MKNAHKFYIG GEWVDPERLR ELHVIDPSTE QSIGTIAIGS TADAERAIKA ARAAFPIFSQ 
TTKAERRALL ERVLMILKRR QHEIGDIISR EMGAPLAMAR ADQAGLGAAH FEETIRAFDA 
FDFEYLQGST RIVHEPIGVV SMITPWNWPI NQIACKVAPA LATGCTMVLK PSEIAPFNAL 
VFAEVMHEAG VPKGVFNLVQ GDGPTVGAAL AGHPDVDMVS FTGSTRAGIA VAQAAAPTVK 
RVHQELGGKS PNILLRSADL GSAVAAGLRR CFANSGQSCN APTRMLVPAE RMDEASAIAA 
RAAASLTVGP PHDPGTDLGP VASAAQFANI QALIEKGIAE GAELVAGGPG RPSNLNAGYY 
VRPTVFACVK NSMTIAREEI FGPVLSIIGY DTEADAVAIA NDTPYGLAAY IQGDPQEART 
LARRLRTGIV RLNQSAWDSA APFGGYKQSG NGREYGKFGL QEFTEIKGIV GHAD