Gene Rleg_4355 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4355
Symbol
ID	8015130
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	4481318
End bp	4482799
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	65%
IMG OID	644826931
Product	succinic semialdehyde dehydrogenase
Protein accession	YP_002978134
Protein GI	241207038
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01780] succinate-semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.00805728
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCTTTCA CCAGCGCACT GACCAAGCAC GTTCCCTTCT CCTCGCCCCT GCTGCGCGAT 
GCCGGCTATA TCGACGGCGT CTGGACATCA GGCGATGCCA CTCGGACTTT CGACGTGCTG 
AACCCGGCAA CCGGCGAGTT GCTCGCCTCA CTGCCCGATA TGGGCGCGGC CGAGACGCGG 
ACGGCAATCG ATGCGGCCCA TGCCGCCCAG CCGGGCTGGG CGGCCCGTCC GGCCAAGGAG 
CGCAGCACGA TCCTGCGCAA ATGGTTCGAC CTGATGGTCG CCAATGCCGA CGAACTCGCG 
GCGATCCTGA CCGCCGAAAT GGGCAAGCCG TTCCCGGAAG CGCGCGGCGA GATCCTTTAT 
GCCGCGGCCT ATATCGAATG GTATGCGGAA GAGGCCAAAC GCATCTATGG CGAGACGATC 
CCCGCGCCTT CCGACGATAA ACGGATGATC GTCATCCGGC AGCCAGTCGG CGTCGTCGGT 
ACGATCACGC CGTGGAACTT CCCGGCGGCG ATGATCACCC GCAAGATCGC CCCGGCGCTT 
GCCGTCGGCT GCACCGTGGT CTCGAAGCCG GCCGAACAGA CGCCGCTGAC GGCGATCGCG 
CTTGCCGTGC TCGCCGAGCA GGCCGGCATT CCGGCCGGCG TCTTCAACGT CATCGTCGGC 
GTGGATGGCC CGGCGATCGG CCGCGAACTC TGCGGCAATG AAAAGGTGCG CAAGATCAGC 
TTCACCGGCT CGACCGAGGT CGGCCGTATC CTGATGCGGC AGTGCGCCGA CCAGATCAAG 
AAGGTGAGCC TGGAGCTCGG CGGCAACGCG CCCTTCATCG TCTTCGACGA TGCCGATCTC 
GACGCTGCCG TCGAAGGCGC GATCGCCTCC AAATACCGCA ATGCCGGCCA GACCTGCGTC 
TGCGCCAACC GCCTCTACGT CCAGTCGAAC GTCTATGACG CCTTCGCCGC CAAGCTTGCC 
GCCAAGGTCG CCGAGATGTC GGTCGGCGAC GGCTTCAAGC CGGGTGTCGT GATCGGGCCG 
CTGATCGACG AGCAAGGCCT TGCCAAGGTG GAGGACCATG TCAGCGACGC GCTTGCCAAG 
GGCGCCAAGG TACTGACCGG CGGCAAGCGC ATCGACGGCG CCGGCACCTT CTTCACGCCG 
ACGGTCCTGA CAGGCGTTGC GCGCGGCATG AAGGTAGCGC GCGAGGAGAC CTTCGGGCCG 
GTGGCGCCGC TCTTTCGCTT CGAGACGGTC GAGGATGTCA TCGCCCAAGC CAATGATACG 
GAATTCGGCC TCGCCGCCTA TTTCTACGCC GGCGACCTGA AGAAGGTCTG GCGGGTGGCG 
GAAGCGCTGG AATACGGCAT GATCGGCATC AATACCGGCC TGATGTCATC CGAGACGGCA 
CCCTTCGGCG GCATCAAGCA ATCCGGCCTC GGCCGCGAGG GCTCGCGGCA CGGCGCCGAC 
GACTATCTGG AAATGAAATA TCTCTGCATC GGCGGCGTCT GA

Protein sequence

MAFTSALTKH VPFSSPLLRD AGYIDGVWTS GDATRTFDVL NPATGELLAS LPDMGAAETR 
TAIDAAHAAQ PGWAARPAKE RSTILRKWFD LMVANADELA AILTAEMGKP FPEARGEILY 
AAAYIEWYAE EAKRIYGETI PAPSDDKRMI VIRQPVGVVG TITPWNFPAA MITRKIAPAL 
AVGCTVVSKP AEQTPLTAIA LAVLAEQAGI PAGVFNVIVG VDGPAIGREL CGNEKVRKIS 
FTGSTEVGRI LMRQCADQIK KVSLELGGNA PFIVFDDADL DAAVEGAIAS KYRNAGQTCV 
CANRLYVQSN VYDAFAAKLA AKVAEMSVGD GFKPGVVIGP LIDEQGLAKV EDHVSDALAK 
GAKVLTGGKR IDGAGTFFTP TVLTGVARGM KVAREETFGP VAPLFRFETV EDVIAQANDT 
EFGLAAYFYA GDLKKVWRVA EALEYGMIGI NTGLMSSETA PFGGIKQSGL GREGSRHGAD 
DYLEMKYLCI GGV