Gene Rleg_5232 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5232
Symbol
ID	8007406
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	-
Start bp	643434
End bp	644930
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	65%
IMG OID	644822140
Product	Succinate-semialdehyde dehydrogenase
Protein accession	YP_002973400
Protein GI	241113565
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01780] succinate-semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.88595
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.882474
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCCG TTTTTGCCCG CCCCGCCTAT CATGACGCGC TGTCGCGGCT CGCCGACCGT 
CATCTCCTGC GCGATCTGGC CTATGTCGGC GGCCGGTGGA TCGCCGGCAA ATCAGGGAAA 
AGTTTCGAGG TCACCGATCC CGCCTCTTCG GCGACGCTGG CCTGGGTTGC TAGCCTTGAC 
GCCGATGAGA CGGCAGTGGC GATCGATGCT GCGTCGGAGG CTTTTGCCGG CTGGCGCGCA 
ATGCTGCCGC AGAGCCGCGC GGCGATCCTG CGCAAATGGT TTGAGCTGAT GCTTGCGGCC 
AAGGAGGATC TGGCGCTGAT CATGACGCTC GAACAGGGCA AGCCGCTTGC GGAATCGCGC 
GGCGAGATCG ATTACGCCGC CTCCTTCGTC GAATGGTATG CCGAGGAAGG CAAACGGCTG 
AACGCCGAAA GCGTCACCAG CCATCTGCCC GGCGCGGAAA TGATCGTCCG GCGTGAGGCG 
CTCGGCATCG TCGGCATCGT CACGCCCTGG AATTTCCCCT CTGCCATGCT CACCCGGAAG 
GCTGCCGCGG CGCTGGCCGC CGGTTGCACG GTCGTCGCCC ACCCCTCCTC AGAAACGCCG 
CTTTCGGCAC TGGCGCTTGC CGAGCTCGGC GAGCGGGCAG GCATTCCCAC CGGCGTCTTC 
AACGTGGTCA CCGGCAACGC CGCAACGATC GTCGGACGGA TGTGTGCCGA TGTCCGCGTG 
CGCGCCATGA GCTTCACCGG CTCCACCGGA ATCGGACGGC TGATCGCCGC CCAATGCGCC 
CCGACCCTGA AGCGGCTGGT GATGGAACTC GGCGGCCACG CCCCGCTGAT CATCTTCGAT 
GACGCTGATA TCGAAAAGGC GGTCGAGATC GCCGTCAACG CCAAATTTGC CACATCAGGC 
CAGGATTGCC TCGCCGCCAA TCGCATTTTC GTCCAGCGGG GGATCGCCGA TGGCTTCGCC 
AAGGCCTTCG CAGACCGCAT TGCCGAACTG AAAGTTGGTC CGGGTCTTGA GGATGGCGCC 
GAGATCGGGC CGCTCATGCA TGAACGCGCC GTCGCCAAGG TCGAAGAACA GGTCGCCGAC 
GCGCTGGCGC GCGGCGCGCG GCTCGTTACC GGCGGCAAGC GCCATAAGGC CGGCCGGCTT 
TTTTATGAGC CGACGCTGCT GAGCGACGTG CCGGCGGATG CGCTGATCAT GCACGAGGAG 
ACCTTCGGCC CTGTAGCGGC CATCACCGCC TTCGATACGG AAGACGAGGT CATCACTCGC 
GCCAACGATA CCGAATACGG CCTTGTCGCC TATATCGTCA CGGAAAACGG CGCCCGGCAG 
ATGCGCCTCG GCCGCGCGCT CGAATACGGC ATGGTCGCCG TCAACCGCGT GAAAATCACC 
GGCGCTCCCA TTCCCTTCGG CGGCTGGAAG CAGTCCGGCC TCGGCCGCGA GGGTTCACGC 
CATGGGCTCG AGGCCTTCAC CGAGCTCAAA TATCTCTGCA TCGACACGGC CGCCTGA

Protein sequence

MTAVFARPAY HDALSRLADR HLLRDLAYVG GRWIAGKSGK SFEVTDPASS ATLAWVASLD 
ADETAVAIDA ASEAFAGWRA MLPQSRAAIL RKWFELMLAA KEDLALIMTL EQGKPLAESR 
GEIDYAASFV EWYAEEGKRL NAESVTSHLP GAEMIVRREA LGIVGIVTPW NFPSAMLTRK 
AAAALAAGCT VVAHPSSETP LSALALAELG ERAGIPTGVF NVVTGNAATI VGRMCADVRV 
RAMSFTGSTG IGRLIAAQCA PTLKRLVMEL GGHAPLIIFD DADIEKAVEI AVNAKFATSG 
QDCLAANRIF VQRGIADGFA KAFADRIAEL KVGPGLEDGA EIGPLMHERA VAKVEEQVAD 
ALARGARLVT GGKRHKAGRL FYEPTLLSDV PADALIMHEE TFGPVAAITA FDTEDEVITR 
ANDTEYGLVA YIVTENGARQ MRLGRALEYG MVAVNRVKIT GAPIPFGGWK QSGLGREGSR 
HGLEAFTELK YLCIDTAA