Gene Rleg_4835 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4835
Symbol
ID	8007223
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	+
Start bp	210037
End bp	211554
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	62%
IMG OID	644821765
Product	Betaine-aldehyde dehydrogenase
Protein accession	YP_002973025
Protein GI	241113190
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0460635
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATGAAC CCTTGACCGC CTCCGAATAC AAGGCGATCG CGGCCGGCCT TCAGTTTCCA 
GCGAATGCCT TCGTCGACGG CGCATTTCGT CCGGCCAATT CCGGGCAGAC ATTCACCTCG 
ACGAATCCCG CGACGGGCGA GGTTCTCGCC GAGATCGCCG CATGCGACGC CACCGATGTC 
GACGCCGCCG TCGCCAAGGC AAAGCAAGCC TTCGACGACG GCCGCTGGCG GCTGCGTTCG 
CCAGGTGAAC GCAAGGCGGT GCTCCTCAAG CTCGCCAGGC TGCTCGAGGA CAATCGTCAC 
GAGCTCGCCG TCATGGAGAG CCTCGATAGC GGCAAGCCGG TCGGCGAATG CCAGACGGTC 
GATGTTCCCG ATACCATTCA CACGATCCGC TGGCACGCCG AACTGATCGA CAAGCTTTAT 
GACAACACCG CGCCTGTCGG CGCCAACGCA CTGACGATGA TCGTGCGTGA GCCGGTCGGC 
GTCGTCGGAT GCGTGCTTCC GTGGAATTTT CCGCTTTTGA TGCTGGCCTG GAAGATCGGC 
CCGGCGCTTG CTGCCGGCTG CTCGGTGATC GTCAAGCCTG CACAGGAGAC GACGCTCACC 
GCGTTGCGCG TCGCCGAGCT TGCCCATGAA GCGGGCATTC CAGCCGGCGT GTTCAATGTC 
GTGACCGGCG GCGGCAAAGA GGTCGGCGAG CCGATCGGCA TGCACATGGA TGTCGATATG 
GTGGCCTTCA CCGGATCGAC GCCCACCGGG CGCCGCTTCC TGCGCTATGC AGCGGACTCG 
AACCTCAAGC GCGTCGTGCT CGAATGCGGC GGCAAGAACC CCGCCGTCGT TCTCGACGAT 
GCCGAAGACC TGGACCTCGT TGCCGAGCAG GTCGTCAATG GCGCCTTCTG GAACATGGGC 
GAGAACTGCT CGGCCACGTC GCGTCTGATC GTTCATTCCA AAGTCAAGGA GGAGCTGCTG 
AAGCGCATCG GCGCCTATAT GCGCGAATGG AAGACGGGCG ATCCGCTCGA CCCTGCAAAC 
CGCATCGGCG CGCTTGTCAG CAAGGCCCAT TTCGAGAAGG TGAAATCCTT CCTCGACGAC 
GCCAGGAAGG AGAAGCTGAC GGTCACCCAC GGTGGTGAAA CGTATGGCGG CATCTTTATC 
GAACCGACAG TGGTCGAGGG TGTGACGCCT GCCAGCCGTC TTTTCCAGGA AGAGATCTTC 
GGGCCGGTGC TTTCGGTCAC CACCTTCAAT TCGCTTGCCG AAGCAATCGC TCTTGCCAAT 
GACACGAATT ACGGTCTGAC GGCGTCCGTC TATACCGGCA GCCTGAGGAA CGCCATCAAA 
CTCTCGCGCG AGATCCGCGC CGGCGTCGTC ACCGTCAACT GCTTTGGAGA AGGCGACGCC 
AGCACGCCGT TTGGCGGCTA CAAGGAGTCC GGCTTCGGCG GCCGCGACAA GTCGGTCTTT 
GCCCATGACA ACTACTGCGA ACTGAAGACC ATCTGGATCG ATGTCTCGGA ACGCTCGGTC 
GACGAGACCA TCCGATGA

Protein sequence

MHEPLTASEY KAIAAGLQFP ANAFVDGAFR PANSGQTFTS TNPATGEVLA EIAACDATDV 
DAAVAKAKQA FDDGRWRLRS PGERKAVLLK LARLLEDNRH ELAVMESLDS GKPVGECQTV 
DVPDTIHTIR WHAELIDKLY DNTAPVGANA LTMIVREPVG VVGCVLPWNF PLLMLAWKIG 
PALAAGCSVI VKPAQETTLT ALRVAELAHE AGIPAGVFNV VTGGGKEVGE PIGMHMDVDM 
VAFTGSTPTG RRFLRYAADS NLKRVVLECG GKNPAVVLDD AEDLDLVAEQ VVNGAFWNMG 
ENCSATSRLI VHSKVKEELL KRIGAYMREW KTGDPLDPAN RIGALVSKAH FEKVKSFLDD 
ARKEKLTVTH GGETYGGIFI EPTVVEGVTP ASRLFQEEIF GPVLSVTTFN SLAEAIALAN 
DTNYGLTASV YTGSLRNAIK LSREIRAGVV TVNCFGEGDA STPFGGYKES GFGGRDKSVF 
AHDNYCELKT IWIDVSERSV DETIR