Gene Rleg_4113 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4113
Symbol
ID	8014911
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	4190999
End bp	4192537
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	65%
IMG OID	644826683
Product	Aldehyde Dehydrogenase
Protein accession	YP_002977893
Protein GI	241206797
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.189618
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATCG CCGTCCTCGA TCTCGCCACC GAAACCGCCA AGCTGCTTGC CGAACTCGGC 
GTCGATGCCG GCCGCTATCA CGGCGGCACG CTTTCCGTCA CCTCGCCGGT CACCGGCAAG 
GAAATCGGCA AACTCAGGGA ACATTCCGTT TCCGAGACGA AGGCGGCGAT CGAAGCGGCG 
CATCAGGCCT TCCTCGAATG GCGTGCCGTG CCGGCGCCGA AGCGCGGCGA ACTGGTCCGC 
CTGCTGGGCG AGGAACTGCG CGCCTCCAAG GCGGCGCTCG GCCGTCTCGT TTCGATCGAG 
GTTGGCAAGA TCACTTCGGA AGGTCTGGGC GAAGTGCAGG AGATGATCGA CATCTGCGAT 
TTCGCGGTCG GCCTTTCCCG TCAGCTTTAC GGCCTGACGA TCGCCACTGA GCGATCCGAG 
CACCGGATGA TGGAAAGCTG GCATCCGCTC GGCGTGATCG GCATCATCTC CGCCTTCAAC 
TTCCCTGTTG CCGTCTGGTC GTGGAATGCC GCACTTGCGA TGGTCTGCGG CAATTCCACC 
GTCTGGAAGC CCTCGGAAAA GACGCCGTTG ACGGCGCTTG CCGTGCAGGC GCTGTTCGAA 
AAGGCGCTGA AGCGTTTCGT CGCCGAGGGC GGTAGCGCAC CGGCCAATCT GTCGACGCTG 
ATCATCGGCG GCCGCGAGGT CGGCGAAGTG CTGGTCGATC ATCCGAAGAT CCCGCTGGTT 
TCCGCCACCG GCTCGACGGC CATGGGCCGC GCTGTCGGTC CGCGCCTGTC GCAGCGTTTT 
GCCCGCGCCA TTCTCGAACT CGGCGGCAAC AATGCGGCGA TCGTCTGCCC GTCGGCCGAT 
CTCGACCTGA CGCTGCGCGG CGTTGCCTTC TCCGCCATGG GTACGGCCGG CCAGCGCTGC 
ACGACGCTGC GCCGTCTCTT CGTCCACGAG AGCGTCTACG ATCAGCTGGT GCCTAGACTG 
CAGAAGGCCT ACGGCTCCGT CACCATCGGC AATCCGCTCG AAACCGGCAC GCTTGTAGGA 
CCGTTGATCG ACGGCCAGGC TTTTAAAAAC ATGCAGGCAG CGCTTGGCGA GGCGAAGTCG 
GCCGGCGGCA CGGTGACCGG AGGCGACCGC GTCGAAAGCG GTTCGACCGA GGCTTTCTAC 
GTTCGCCCGG CGCTCGTGGA AATGCCTGAT CAGACCGGAC CGGTGGAGCA CGAGACCTTC 
GCGCCGATCC TCTATGTGAT GAAATACAGC GATTTCGACG AGGTGCTGGC GCTGCACAAT 
GCCGTGCCGC AGGGGCTGTC GTCGTCGATC TTCACCAACG ACATGCGCGA GGCCGAAACC 
TTCGTCTCCG CCCGCGGTTC GGATTGCGGC ATCGCCAACG TCAACCTCGG GCCATCGGGC 
GCCGAGATCG GCGGCGCCTT TGGCGGCGAG AAGGAGACCG GCGGCGGCCG TGAATCCGGC 
TCGGATGCCT GGAAGGCCTA TATGCGCCGC TCCACCAACA CGATCAATTA CGGCAGGACG 
CTGCCGCTGG CGCAGGGCGT CAAGTTCGAC GTCGAATAA

Protein sequence

MTIAVLDLAT ETAKLLAELG VDAGRYHGGT LSVTSPVTGK EIGKLREHSV SETKAAIEAA 
HQAFLEWRAV PAPKRGELVR LLGEELRASK AALGRLVSIE VGKITSEGLG EVQEMIDICD 
FAVGLSRQLY GLTIATERSE HRMMESWHPL GVIGIISAFN FPVAVWSWNA ALAMVCGNST 
VWKPSEKTPL TALAVQALFE KALKRFVAEG GSAPANLSTL IIGGREVGEV LVDHPKIPLV 
SATGSTAMGR AVGPRLSQRF ARAILELGGN NAAIVCPSAD LDLTLRGVAF SAMGTAGQRC 
TTLRRLFVHE SVYDQLVPRL QKAYGSVTIG NPLETGTLVG PLIDGQAFKN MQAALGEAKS 
AGGTVTGGDR VESGSTEAFY VRPALVEMPD QTGPVEHETF APILYVMKYS DFDEVLALHN 
AVPQGLSSSI FTNDMREAET FVSARGSDCG IANVNLGPSG AEIGGAFGGE KETGGGRESG 
SDAWKAYMRR STNTINYGRT LPLAQGVKFD VE