Gene Rleg_5024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5024
Symbol
ID	8007615
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	-
Start bp	411094
End bp	412551
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	63%
IMG OID	644821939
Product	succinic semialdehyde dehydrogenase
Protein accession	YP_002973199
Protein GI	241113364
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01780] succinate-semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.597938
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGGAT TAAGGGATAG CAGTCTGCTT CGTGAGCTGG GGCTGATCGA CGGAGAATGG 
CGCGGGGCTG AAGCTGGGCG CACGATCGAG GTGATCGATC CGGCGACGCA ACATGTGCTG 
GGCACGGTGC CTGACATGGA CGGAGCCGAT ACGACGACGG CGATCGCGGC GGCGGAAAAG 
GCCTTCGGTC CATGGCGCGC AAAGACCAAT GCCGAGCGCG GCGCATTGCT GGAAGCCTGG 
CATGATCTGA TGCTCGACAA TATCGAGGAT CTGGCGCTGA TCCTCACCCG AGAGCAGGGC 
AAGCCACTGA CGGAAGCGCG CGGCGAAATC CGCTACGGCG CCTCCTTCAT CAAATGGTTT 
TCCGAGGAGG CACGCCGCAT CGGCGGAACG ACCATTCCCT CGCCGACAGC GGACCGGCGG 
ATCGTCGTTC TGAAGGAGCC CGTCGGCGTA TCGGCGATCA TCACGCCGTG GAATTTTCCG 
AATGCGATGA TCACCCGCAA GGTCGGGCCG GCGCTCGCAG CAGGCTGCAC CGTCGTCGTC 
AAGCCATCGG ACCTCACCCC TTATTCGGCG CTGGCGCTCG GCGTATTGGC GGAGCGCGCC 
GGCATCCCCA AGGGCGTGAT CAATATCGTC ACCGGCATGC CGGCCGGCAT CGGCGACGAA 
CTGATGGCGA ACCAGACCGT TCGCAAGATC TCTTTCACCG GCTCGACCCG CGTCGGCTCG 
CTGCTGATGC GCGGCGCGGC CGACAGCATC AAGCGACTCA GCCTCGAACT CGGCGGCAAC 
GCGCCCTTCA TCGTCTTCGA CGATGCCGAT CTTGATCTGG CCGTGGAAGG CGCAGTTGCC 
TCGAAATTCC GCAATGGCGG GCAGACCTGC GTCTGCGCCA ACCGGCTTCT CGTCCAGTCC 
GGCGTCTATG AGGCCTTTGC CGCCAAACTT TCCGCGCGCG TATCGGCCAT GAAGGTCGGG 
GCCGGCACGG ATGCAGGCAC GGATATCGGG CCGATGATCA ACAAGGCGGC GATCGACAAG 
ATCAAGCGTC ATGTCGACGA TGCGGTGGAA AAGGGAGCAA GCATCCTCGC CACCGCAGAT 
TCCGTGCCTG AAGGCGACCA ATATGCGGTG CCGATGGTGC TCGGCGGTGC GACGACCGAG 
ATGCAGCTTG CCAGCGAAGA GACCTTCGGA CCCGTTGCCC CGCTTTTCCG TTTCGACCAC 
GAGGAAGAGG CGATCCGCAT AGCCAACGCC ACGCCCTTCG GGCTTGCGGC CTATTTCTAC 
ACCGGGAGCC TGAAACGCTC CTGGCGTGTC GCCGAAGCCC TCGAATTCGG GATGGTCGGC 
CTGAACACAG GGGCGATCTC GACCGAGGTG GCTCCCTTCG GCGGCGTCAA ACAATCCGGT 
CTTGGCCGCG AGGGCGCGCA GTGCGGCATC GAGGAATATC TCGAAATGAA GAGCTTCCAC 
ATCGGCGGTC TCGCCTAA

Protein sequence

MNGLRDSSLL RELGLIDGEW RGAEAGRTIE VIDPATQHVL GTVPDMDGAD TTTAIAAAEK 
AFGPWRAKTN AERGALLEAW HDLMLDNIED LALILTREQG KPLTEARGEI RYGASFIKWF 
SEEARRIGGT TIPSPTADRR IVVLKEPVGV SAIITPWNFP NAMITRKVGP ALAAGCTVVV 
KPSDLTPYSA LALGVLAERA GIPKGVINIV TGMPAGIGDE LMANQTVRKI SFTGSTRVGS 
LLMRGAADSI KRLSLELGGN APFIVFDDAD LDLAVEGAVA SKFRNGGQTC VCANRLLVQS 
GVYEAFAAKL SARVSAMKVG AGTDAGTDIG PMINKAAIDK IKRHVDDAVE KGASILATAD 
SVPEGDQYAV PMVLGGATTE MQLASEETFG PVAPLFRFDH EEEAIRIANA TPFGLAAYFY 
TGSLKRSWRV AEALEFGMVG LNTGAISTEV APFGGVKQSG LGREGAQCGI EEYLEMKSFH 
IGGLA