Gene Rleg_0002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0002
Symbol
ID	8011254
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	1743
End bp	2825
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	62%
IMG OID	644822593
Product	Saccharopine dehydrogenase
Protein accession	YP_002973853
Protein GI	241202757
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1748] Saccharopine dehydrogenase and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.717423
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0043893
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGTTTCG AAAAGATCGC CGTTCTCGGC CTGGGCAAGG TCGGACGGCT GGCGGCGACG 
CTGTTGCATG AAGGCGGCTT CGAGGTCATC GGCGTCGATG CGCAATTGCC GCTGAGCGAC 
GTCCCCTTCA AGTGCCGCAT CGGCGATATC TCCGATCCTC AAGTGATCGG CGAACTGCTC 
TCGAATGTCG AGGCGGTGCT GTCCTGCCTG CCCTATCATT TGAATATCGA GCTGGCGCGC 
GCCGCCCATC TTGCCGGCAT TCATTATTTC GATCTGACCG AAGACGTTCC GACCACCAAT 
TTCATCATCG AGCTGTCGAA GACAGCCCGC GGCCTGATGG CGCCGCAATG CGGCCTGGCG 
CCGGGTTTCG TCGGCATCAT CGGTGCAAGC CTGGCCGACG GCTTCGATCG CTGCCGGTCG 
ATCCGCATGC GCGTCGGCGC CCTGCCGCAG CATCCGACCG GACTGCTCGG CTACGCCTTC 
AACTGGTCGC CCGAGGGCGT CGTCAACGAA TATCTGAACG ACTGCGAGGT CATCGAGGGC 
GGTGTGCGCA AGCTTGTCTC GCCGATGGAA TGGCACGAGA CCGTCTATGT CGGCGGCGTC 
AAGCTCGAAG CCTTCACGAC GTCCGGCGGC CTTGGCACCA TGTGTGACAC CATGCTCGGC 
AAGATCGACA ATCTCGATTA CAAGACCATG CGTTATCCCG GCCATATGGA GCTGATGAAT 
TTCTTCTTCC ACGAGCTGTT GATGCGCGAC AAGCGCAAGC TCGCCGGCGA GATCCTGACC 
AATGCCAAGC CGCCGGTTGA AGACGATGTT GTCTATGTCC ATGTCGCCGC CGAAGGCACC 
GAGAATGGCA GCCTGCGCCG CAAGGAATTC GTGCGCGCCT ATTACCCGAT CGAGATTGCC 
GGCGCGCGCC GCACGGCGAT CGCCTGGACG ACGTCAGCCT CCGTCGTCGC CGTCATCGAG 
ATGGTCCGCG ACGGCCTGCT GCCGACGACC GGCTTCCTGC ACCAGGAGCA TATTCCGCTG 
GAGATGTTTT TGAAGACGCC GACCGGCAGC CTCTTCAAGG CGGGTGCGAC CAGCCACGGC 
TAA

Protein sequence

MSFEKIAVLG LGKVGRLAAT LLHEGGFEVI GVDAQLPLSD VPFKCRIGDI SDPQVIGELL 
SNVEAVLSCL PYHLNIELAR AAHLAGIHYF DLTEDVPTTN FIIELSKTAR GLMAPQCGLA 
PGFVGIIGAS LADGFDRCRS IRMRVGALPQ HPTGLLGYAF NWSPEGVVNE YLNDCEVIEG 
GVRKLVSPME WHETVYVGGV KLEAFTTSGG LGTMCDTMLG KIDNLDYKTM RYPGHMELMN 
FFFHELLMRD KRKLAGEILT NAKPPVEDDV VYVHVAAEGT ENGSLRRKEF VRAYYPIEIA 
GARRTAIAWT TSASVVAVIE MVRDGLLPTT GFLHQEHIPL EMFLKTPTGS LFKAGATSHG