Gene Rleg2_3830 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_3830
Symbol
ID	6982593
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	3962210
End bp	3963271
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	62%
IMG OID	643398552
Product	histidinol-phosphate aminotransferase
Protein accession	YP_002283318
Protein GI	209551401
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCGCT ACTGGTCTGA TATCGTCAGC AAGCTCCGAC CCTATGTCGC CGGGGAGCAA 
CCCCGTATCC CCGGTCTGGT CAAGCTCAAC ACCAACGAGA ACCCCTACGG CCCGTCTCCA 
GCGGCGCTGG AAGCGATCGG CCAAGCGGCG GATGATCGTC TGCGGCTCTA TCCCGATCCG 
GCGGCGACGG AATTGCGCGA GACGATCGCT GCCCGTCACG GCCTGACGGC GGATGAAGTC 
TTCGTCGGCA ACGGCTCAGA CGAGGTCCTC GCCCATGCGT TTCAGGCGCT GCTGAGACAT 
GAACTGCCGC TTCTCTATCC CGACATAAGC TACAGCTTCT ATCCGACTTA TAGCCTGCTA 
TACGACATCG AAGCGATCGA AGCGCCGGTC GATGATACGT TCCAGATCCG GCTGGCGGAT 
TACGACAGGC CGTGCGGGGC GATCATCATC CCCAATCCGA ATGCGCCGAC CGGCATCGGC 
TTGCCGCTTG CCGACATAGA GGCGCTTGTC GCCACCCATC CGGACGCGGT CGTGGTGATC 
GACGAGGCCT ATGTCGATTT CGGCGGTGAC AGTGCCATCC CGCTCATTTC CAAATATCCC 
AACCTGCTTG TCGTTCAGAC CTTGTCGAAA TCCCGCTCCT TTGCCGGCCT GCGCGTCGGT 
TTCGCGCTTG GGCAGCGGGA GCTGATCGAG GCGCTGGTGC GCGTCAAGGA CAGCTTCAAT 
TCCTATCCGC TCGATCGCCT GGCGCAGGTT GCCGCAACGG CGGCGATCAA GGACGAGGCG 
TGGTTCGAGG CATGCCGGAC GAAGCTCATC GCCAGCCGGG ACGGTCTCGT CCGGGACCTC 
GAAGCGCTGG AATTCGAAGT GCTGCCGTCT CAGGCGAATT TCGTTTTCGC ACGGCATGAA 
AGCCGGTCGG GTGCCGCGCT GCAAGCCGCT CTGCGGGAGC GAGGTGTTCT CGTTCGGCAT 
TTCGCCAAGC CGCGCATTTC GGATTTCCTG CGCATCAGCA TCGGCACGAA CGAGGAGTGC 
GCCCGTCTGG TTTCCGCTCT CAAGGAAATA CTGGCAGCCT GA

Protein sequence

MSRYWSDIVS KLRPYVAGEQ PRIPGLVKLN TNENPYGPSP AALEAIGQAA DDRLRLYPDP 
AATELRETIA ARHGLTADEV FVGNGSDEVL AHAFQALLRH ELPLLYPDIS YSFYPTYSLL 
YDIEAIEAPV DDTFQIRLAD YDRPCGAIII PNPNAPTGIG LPLADIEALV ATHPDAVVVI 
DEAYVDFGGD SAIPLISKYP NLLVVQTLSK SRSFAGLRVG FALGQRELIE ALVRVKDSFN 
SYPLDRLAQV AATAAIKDEA WFEACRTKLI ASRDGLVRDL EALEFEVLPS QANFVFARHE 
SRSGAALQAA LRERGVLVRH FAKPRISDFL RISIGTNEEC ARLVSALKEI LAA