Gene Rleg2_5063 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5063
Symbol
ID	6978157
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	-
Start bp	710868
End bp	711929
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	61%
IMG OID	643394201
Product	homoserine dehydrogenase
Protein accession	YP_002279019
Protein GI	209547101
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGTCT ACAATATCGC ACTGATCGGC TTCGGCGGCG TCAACCGTGC GCTTGCCGAA 
TTAATTGCTT CGAAAAACCC GCTCTGGGAA CGTGACCTCG GCTTCCGTCT GAACATCGTT 
GCCGTAAGTG ACCTTTACCT CGGCTCTGTC ATTTCACCGA ACGGCCTGGA CGCAACAACG 
CTTGTTGAAT CCAAATTCGC CAAGGGCGGC TTCAGCCAAC TCTCTGGTGG AAGTGCCGAG 
GCCAACAACG AAGTCGTCAT CAAGAATGCT CCGGCAGACA TCATCGTCGA AGCTACCTTC 
ACCAATCCGA AAGACGGCGA GCCCGCAGTC TCCCACTGCC GCTGGGCTCT CGAGGGCGGC 
AAGCACGTCG TGACGACCAA TAAGGGTCCG GTGGCGATCG CCGCGCAGGA GCTCAAGGCT 
CTTGCGAAGA AGAATGGCGT TCGCTTCGAA TATGAAGGCT CCGTCATGAG CGGAACCCCG 
GTTATCCGAA TGGTGGACAA GACGCTGGCG GGTGCGGAGC TGAATGGCTT CGAAGGCATC 
CTCAATGGGA CGTCGAACTT CGTCCTCGGC CGGATGGAAA CGGGCATGGA CTTCTCCGCT 
GCAGTGAAGG AAGCTCAGGA GCTCGGCTAT GCCGAAGCGG ACCCCACAGC CGACGTCGAG 
GGGTTCGATG TGCGGCTCAA GGTCGTCATC CTCGCCAACG AGCTGCTCGG GGCGAACCTC 
ACGCCGGACG ACGTCGCGCG CAAGGGCATC TCTGGCCTGA CCGCCGCCGA TATCGACACC 
GCCAAGAAGG CCGGCAGCCG CTGGAAGCTC ATCGGCTCCG CCATTCGTAA CGCCGATGGC 
TCCGTCACTG GCAGCGTCGA GCCCAAGTGC CTTCCGCTGG AGCACCCGCT TGCAGCAGTG 
AGTGGCGCGA CCAATGCTGT GTCTCTGAAT ACCGAACTCC TCGGCTCCGT GACCGTCACT 
GGTCCAGGCG CCGGCCGTAT CGAGACGGCA TACGCACTTC TCTCCGATAT AGTCGCCATC 
CACAACCTCG CCGGCGCGAA CCTCAAGAAG GAGGCTGCAT GA

Protein sequence

MTVYNIALIG FGGVNRALAE LIASKNPLWE RDLGFRLNIV AVSDLYLGSV ISPNGLDATT 
LVESKFAKGG FSQLSGGSAE ANNEVVIKNA PADIIVEATF TNPKDGEPAV SHCRWALEGG 
KHVVTTNKGP VAIAAQELKA LAKKNGVRFE YEGSVMSGTP VIRMVDKTLA GAELNGFEGI 
LNGTSNFVLG RMETGMDFSA AVKEAQELGY AEADPTADVE GFDVRLKVVI LANELLGANL 
TPDDVARKGI SGLTAADIDT AKKAGSRWKL IGSAIRNADG SVTGSVEPKC LPLEHPLAAV 
SGATNAVSLN TELLGSVTVT GPGAGRIETA YALLSDIVAI HNLAGANLKK EAA