Gene Rleg_5393 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5393
Symbol
ID	8007351
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	-
Start bp	807267
End bp	808658
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	62%
IMG OID	644822297
Product	Aldehyde Dehydrogenase
Protein accession	YP_002973557
Protein GI	241113722
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.587112
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGTCTA CCATGAAGGT CTACCAGGCG TTCAACCGCA AGCCGATTGC AGAGCTGCCG 
GCAGACGACG TGGCCGCACT CGAGCGCAAG CTTCAGCTCG CCGCCAAAAG CTTCGCCGAT 
CGCGATGGCT GGCTGCCCCC GCATCAACGG ATGGCGATCC TCAGAAAGGC GTCGGCGCTT 
CTGCAGGAGA ACCGCGATCG TTTTGCGATG ATGATCGCCC GTGAAGGCGG CAAGCCGCTG 
ACGGATGCGA TCATCGAGGT GACGCGCGGG ATCGACGGCC TCCTCAATGC GGCGGACGAG 
CTGCGCAATT TCGGCGGCAA GGAAATCCCC ATGGGGCTGA CCGCGGCCAG CGCCAACAGA 
TGGGCTTTCA CCACCAAGGA GCCGATCGGC GTCGTGGCGG CGATCTCGGC CTTCAACCAT 
CCGCTCAATC TCATCATCCA CCAGATCGCG CCGGCGATCG CGGTCGGCTG CCCGGTTATC 
GTGAAGCCGG CGGCAACGAC GCCGATTTCC TGCATCGAGA TCGTCAAGCT GTTCTGGGAG 
GCAGGTCTCG ATGAGCGCTG GTGCCAGACC CTCATCACCG AGGACAACGC GCTTGCCGAA 
GCCTTTGCAA CCGATCACCG CGTCGCGTTT TTGAGCTTCA TCGGTTCCGC CAAGGTCGGC 
TGGTACCTCA AGGGCAAGCT GCCGCCGGGG ACCCGATGCG CGCTTGAGCA CGGTGGAGCG 
GCACCCGTCA TCGTCGACCG CAGCGCCAAT GTCGATGCGA TCGTCGGCAC CATTGTCAAA 
GGTGGCTATT ATCACGCCGG GCAAGTCTGC GTGTCGGCCC AGCGTCTCTT CGTGCATGAA 
GATATTCTGG CTTCCTTCAC CGAGGCTCTC GCTGCCAGGG TGGCAGCTCT GCATGTCGGC 
GATCCCACGC TTATGCAAAC CGAGGTAGGG CCGCTCATCC TGCCACGCGA GGCAGACCGC 
GTCGCCGCCT GGATCAAGGA GGCGACGGAC GCCGGAACCA GGCAGATCGG CGGCGGTCGG 
ATGTCCGAGA CGACACTTCT GCCTTCGGTT TTGCTGGACC CGCCTACTGA AGCGAAAGTA 
TCCATGCTCG AGGTCTTTGG ACCGCTGACC TGCGTCTACG GCTACCGCGA CCTCGACGAA 
GCGATCCGCA TTGCCAACTC GCTGCCCTAT GCCTTCCAGG CGAGCGTCTT TTCCGCCGAC 
ATAGCGGTTG CTCTCAGGGC GGCAAAACAT TTGGATGCAT CGGCCGTTCT CGTCAACGAC 
CACACCGCGT TCCGCACCGA TTGGATGCCT TTCGCCGGAC GCAGACAGTC AGGATACGGC 
GTCGGCGGCA TTCCCTGGAC GATGGAAGAA ATGGCCGACG ACAAGATGGT GGTATTCAAC 
CAGGTGACTT AG

Protein sequence

MQSTMKVYQA FNRKPIAELP ADDVAALERK LQLAAKSFAD RDGWLPPHQR MAILRKASAL 
LQENRDRFAM MIAREGGKPL TDAIIEVTRG IDGLLNAADE LRNFGGKEIP MGLTAASANR 
WAFTTKEPIG VVAAISAFNH PLNLIIHQIA PAIAVGCPVI VKPAATTPIS CIEIVKLFWE 
AGLDERWCQT LITEDNALAE AFATDHRVAF LSFIGSAKVG WYLKGKLPPG TRCALEHGGA 
APVIVDRSAN VDAIVGTIVK GGYYHAGQVC VSAQRLFVHE DILASFTEAL AARVAALHVG 
DPTLMQTEVG PLILPREADR VAAWIKEATD AGTRQIGGGR MSETTLLPSV LLDPPTEAKV 
SMLEVFGPLT CVYGYRDLDE AIRIANSLPY AFQASVFSAD IAVALRAAKH LDASAVLVND 
HTAFRTDWMP FAGRRQSGYG VGGIPWTMEE MADDKMVVFN QVT