Gene Rleg2_0153 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_0153
Symbol
ID	6978863
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	149385
End bp	150404
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	65%
IMG OID	643394864
Product	Pyridoxal 4-dehydrogenase
Protein accession	YP_002279681
Protein GI	209547764
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0408044
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.014081
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACGA GACGCATCGG CAAGACCAAG CTTGAGGTGA CCGAAATCAG CTTCGGCGCC 
GCAGCGCTCG GCGGCCTCTA CCGCGCCTGC CCGCGCGAGG TAGCGATGGA CACGCTGCAG 
GCAGCCTGGG ACAGCGGCAT CCGCTATTTC GACGTGGCGC CCTGGTACGG GCTGGGCCTC 
GCCGAACGCC GCGTCGGCGA TTTCCTGCGC GACCAGGCTG ATGGCTCTTA CGTGCTGTCG 
ACCAAGGTCG GCCGGCTGCT TCGGCCGGTG CCGACCGGAA GCGTGCCCGA TTACAGCTAT 
GTCGATCCGC TCTCCTTCGA TGCCGATTAC GACTATTCCT ATGACGGCAT CATGCGTTCG 
GTCGAATTCA GCTATGCCCG CCTCGGCCTC AACCGCATCG ATATTCTCTA CGTGCACGAT 
ATCGGCGGCT ATACGCATGG CGCGGTAAAG AACGCCGTCT ACCAGAAGCA GCTGCTCGAT 
TCCGGCATCA AGGCGCTCGA AGAACTGAAA TCCTCAGGCG CGATCGCCGC CTTCGGCCTC 
GGCGTCAACG AAGTGCCCGT CTGCCTCGAC GTCATGCGCA ACGCCGATCT CGACTGCATC 
CTGATGGCCG GCCGCTATAC GCTGCTCGAC CGGTCGGCGG TCGCCGAACT TCTGCCGCTC 
TGCCAGCAGA GGGGCACGTC GCTGGTCGTC GGCGGCGTCT TCAACTCCGG CATTCTCGCC 
ACCGGCCCGG TGCCGGGCGC GCATTTCGAC TATATGCCGG CCGATGACGA GGTGCTCGCC 
AAGGTCGGCG CCATGGAGAC GATCGCCAAA CGCCACGGCG TGCCGCTCGC CGCGCCGGCC 
CTGCAGTTTC CGCTGCGCGA ACCGATCGTC GCATCGGTGC TGATCGGCAC CGCCAAGCCG 
TCGAGCCTGA TCCGCAACAT GGAGATCGTC GAGCCGCGGC TTGCCGATGA GATCTATGCC 
GAATTCGAGC CCTATACGCT GGTCGCGCCG CCGCTCGGCG CCGAAGCTGT CCGGGTCTGA

Protein sequence

MKTRRIGKTK LEVTEISFGA AALGGLYRAC PREVAMDTLQ AAWDSGIRYF DVAPWYGLGL 
AERRVGDFLR DQADGSYVLS TKVGRLLRPV PTGSVPDYSY VDPLSFDADY DYSYDGIMRS 
VEFSYARLGL NRIDILYVHD IGGYTHGAVK NAVYQKQLLD SGIKALEELK SSGAIAAFGL 
GVNEVPVCLD VMRNADLDCI LMAGRYTLLD RSAVAELLPL CQQRGTSLVV GGVFNSGILA 
TGPVPGAHFD YMPADDEVLA KVGAMETIAK RHGVPLAAPA LQFPLREPIV ASVLIGTAKP 
SSLIRNMEIV EPRLADEIYA EFEPYTLVAP PLGAEAVRV