Gene Rleg_0442 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0442
Symbol
ID	8011642
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	457852
End bp	459312
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	61%
IMG OID	644823036
Product	Aldehyde Dehydrogenase
Protein accession	YP_002974290
Protein GI	241203194
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACGC TTCGCATTCT CAATTGGATC AACGGCCAGG CCAGCCACGC CTCGAGTGAA 
GGATGGCTTG AGAAATTCAA TCCGCACAGT GGCGAACTCC TTTATCACGT GGCTGACTCC 
TCGCAGGATG ATGTTGAGCA AGCAATAACG GCAGCGCGTT CGGCGTTCCC AGCCTGGGCG 
GAGCTTACAC CCGTAAAGCG CGGCCAGATT CTGATGGATA TCGTCGCCCT GATGAAGCGA 
CGTTCCGATG AGCTGGCGGA ATGCATTGCG CTTGAAACCG GCAAACCTCC CCAGGACGCC 
AAAGGCGAGA CGGGCGGAGC GATCATGCAG GCGGAATATT TCGCCGGCGA GGGTATGCGC 
CTATACGCCC GGTCGCTCAC CTCAGGCACG CCCGGCAAAT ACAGCCACAC AGTGCGCCAA 
CCTCGTGGCG TAGCCGGTCT GATCGTGCCG GCAAATACGC CGATCGCCAA TATCGCATGG 
AAGACTTTTC CTGCGCTTAT TTGCGGCAAC ACGGTGGTTC TGAAAGCTGC CGAGGACTCT 
CCACGCATAG CCCAACTCTT TGCCGAGCTG ACCAAGGAGG CGGGATTGCC CGACGGCGTA 
TTCAACGTCG TACATGGGCG TGGCGAGCCG GCTGGCTCGA CGTTGGTCAC AGACGAGCGG 
GTCGACATTA TCAGCTTCAC GGGCTCGACC GGAGTAGGCC GCAGGATTGC GGAAGTCGCT 
GGAAAGCGTC TCGCACGTAT TTCTCTCGAA CTGGGCGGCA AGAACCCCTT CGTCGTCTGT 
GATGACGCCG ATCTCGATCA GGCGGTGCAC TGGGCGGCGC TGTCGGCCTT CAGCAATGCC 
GGCCAGCGCT GCGCCGCAGG TAGCCGCATG CTGGTGTTTA AATCGGTCTA CGAGGAGTTT 
CGGGACCGAC TGACCGCAAA GGCCAGAAGC CTCAAGCTAG GTGTTGCCGC CGGATGCGAT 
CTCGGGCCGC TCGTCAGCCT CCGCCAACAG CAGTCCGTGC TTTCCGCCAT CGAACGCGCA 
AAAGAACAAG GCGGCCAGGT GCTTTGCGGG GGGCGCACAC CGGACGCACC GGAGTTGGCC 
GGAGGCTATT ATGTCGAGCC TACAGTTATC GATGGCCTTG CCACCACGTC GGATCTCAGT 
TGCAAGGAAG TCTTCGGTCC GGTGACGACA CTCCATCCCG TCGGCAGCAT GACCGAGGCG 
CTGGATGTAG CAAACGCCAC CGAATACGGA TTGACCGCTG CTGTGCATAC CCGCAACGTC 
GATCGCGCGA TGTGGTTCGC CCAAAGGGTC AAAGCCGGCG TCGCCAATGT CAACATGGGT 
ACGTATGGCA GCGAGCCGCA CATGCCGTTC GGCGGCTTCG GGTCGTCCGG GAATGGCACG 
CGCGAGCCTG GAGTCGAGGC GCTCGATGTG TATTCGGAAC TGAAAAACAT CTCCTTCCTT 
GTCCGCCCGG GGATGCTTTG A

Protein sequence

MTTLRILNWI NGQASHASSE GWLEKFNPHS GELLYHVADS SQDDVEQAIT AARSAFPAWA 
ELTPVKRGQI LMDIVALMKR RSDELAECIA LETGKPPQDA KGETGGAIMQ AEYFAGEGMR 
LYARSLTSGT PGKYSHTVRQ PRGVAGLIVP ANTPIANIAW KTFPALICGN TVVLKAAEDS 
PRIAQLFAEL TKEAGLPDGV FNVVHGRGEP AGSTLVTDER VDIISFTGST GVGRRIAEVA 
GKRLARISLE LGGKNPFVVC DDADLDQAVH WAALSAFSNA GQRCAAGSRM LVFKSVYEEF 
RDRLTAKARS LKLGVAAGCD LGPLVSLRQQ QSVLSAIERA KEQGGQVLCG GRTPDAPELA 
GGYYVEPTVI DGLATTSDLS CKEVFGPVTT LHPVGSMTEA LDVANATEYG LTAAVHTRNV 
DRAMWFAQRV KAGVANVNMG TYGSEPHMPF GGFGSSGNGT REPGVEALDV YSELKNISFL 
VRPGML