Gene Rleg_0038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0038
Symbol
ID	8011285
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	34214
End bp	35278
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	62%
IMG OID	644822628
Product	tryptophanyl-tRNA synthetase
Protein accession	YP_002973888
Protein GI	241202792
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0180] Tryptophanyl-tRNA synthetase
TIGRFAM ID	[TIGR00233] tryptophanyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0701529
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.176582
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAAT TCAAGAAACT CGTATTCTCC GGCGTGCAGC CGACCGGCAA TCTGCATCTC 
GGCAATTATC TCGGCGCGAT CCGCCGGTTC GTGGCGCTGC AGGAAGGCAA TGACTGCATC 
TACTGCGTCG TCGACATGCA TGCGCTCACC GCCCAGCTCG TGCATGAGGA CATGCCGAGC 
CAGACGCGCT CGATCGCCGC CGCCTTCATC GCTGCCGGCA TCGATCCGGA AAAGCATATC 
GTCTTCAATC AGTCGGCCGT GCCGCAGCAT GCCGAACTCG CCTGGATCTT CAACTGCGTC 
GCCCGCATCG GCTGGATGAA CCGGATGACG CAGTTCAAGG ACAAGGCCGG CAAGGACCGC 
GAGCAGGCCT CGCTCGGGCT CTACGCCTAT CCGAGCCTGA TGGCCGCCGA CATTCTCGTC 
TATCGCGCCA CCCATGTGCC TGTTGGTGAG GACCAGAAGC AGCATCTGGA GCTTGCCCGC 
GACATCGCGA TGAAGTTCAA CCTCGACTAT GCCGAGCATA TCAGCAGGAC CGGTTACGGC 
GTCGACATCA CCGTCGGCAA CGAGCCGGTG CATGCCTATT TCCCGATGGT CGAGCCGTTG 
ATCGGCGGGC CGGCGCCGCG CGTCATGTCG CTGCGCGACG GCACCAAGAA AATGTCGAAG 
TCGGACCCTT CCGATCTCTC GCGCATCAAC CTGATGGACG ACGAGGACGC TATCTCGAAG 
AAGATCCGCA AGGCCAAGAC CGATCCTGAC GGCTTGCCGA GCGAGATCGA CGGGCTGCAG 
GGCCGTCCGG AAGCCGACAA TCTGGTGGCG ATCTATGCCG CACTCGCCGA CAAGTCGAAG 
GCGGACGTGC TTGCCGAATT CGGCGGCCAG CAATTCTCCG TCTTCAAGCC GGCGCTGGTC 
GACCTGGCGA TCAACGTGCT CGCACCGATC ACCGGCGAAA TGCGCCGGCT GATGGATGAT 
ACCAGCCATA TCGACGCGAT CCTGCGCAAG GGCGGCGAGC GCGCAAGGGC GCGCGCAGAG 
GTGACGATGC GCCAAGTGCG CGACGTCATC GGCTTCCTGT ATTGA

Protein sequence

MSEFKKLVFS GVQPTGNLHL GNYLGAIRRF VALQEGNDCI YCVVDMHALT AQLVHEDMPS 
QTRSIAAAFI AAGIDPEKHI VFNQSAVPQH AELAWIFNCV ARIGWMNRMT QFKDKAGKDR 
EQASLGLYAY PSLMAADILV YRATHVPVGE DQKQHLELAR DIAMKFNLDY AEHISRTGYG 
VDITVGNEPV HAYFPMVEPL IGGPAPRVMS LRDGTKKMSK SDPSDLSRIN LMDDEDAISK 
KIRKAKTDPD GLPSEIDGLQ GRPEADNLVA IYAALADKSK ADVLAEFGGQ QFSVFKPALV 
DLAINVLAPI TGEMRRLMDD TSHIDAILRK GGERARARAE VTMRQVRDVI GFLY