Gene Mext_0294 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_0294
Symbol
ID	5832454
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	331146
End bp	332207
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	67%
IMG OID	641366079
Product	tryptophanyl-tRNA synthetase
Protein accession	YP_001637789
Protein GI	163849746
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0180] Tryptophanyl-tRNA synthetase
TIGRFAM ID	[TIGR00233] tryptophanyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.496301
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGCGT TCACCGAACT CGTGTTCTCC GGCGTCCAGC CGACCGGGAA CCTGCACCTC 
GGCAATTATC TCGGCGCCAT CAAGCGCTTC GTCGAGATGC AGGCGCGCGA CGCGCAGTGC 
CTCTATTGCG TGGTCGATCT CCACGCCATC ACGATGTGGC AGGACCCGGA GGCGCTCAAG 
GGCCAGATCC GCGAAGTGAC GGCGGCCTTC CTCGCCGCCG GCATCGATCC GAAGCGCTCC 
ATCGTCTTCA ACCAGTCCCA GGTGCCGCAG CACGCGGAAC TCGCCTGGAT CTTCAACTGC 
GTCGCCCGCC TCGGCTGGCT CAACCGCATG ACGCAGTTCA AGGACAAGGC CGGCAAGGAC 
CGGGAGAACG CCTCCATCGG TCTCTACGAT TACCCCGTGC TGATGGCCGC CGACATCCTC 
GCCTATCGTG CCACGCATGT GCCCGTGGGC GAGGATCAAA AGCAGCACCT CGAACTGACC 
CGCGACATCG CGCAGAAGTT CAACAACGAC TTCGCGGGGT CGATCCTGGC GCATGGCCAC 
GGCGAACAGT TCTTCCCGAT CACCGAGCCG CTGATCGGTG GGCCGGCGGC GCGCGTGATG 
TCCCTACGCG ACGGCACCAA GAAGATGTCG AAGTCGGACC CGTCCGAGTA TTCGCGCATC 
GCGCTCACCG ACGACGCCGA CGCCATCGCC CAGAAGGTGC GCAAGGCCAA GACCGATCCG 
GAGCCCCTCC CCTCGGAGGT TGCGGGCCTG GCCGGTCGGC CGGAGGCCGA CAACCTCGTC 
GGCATCTTCG CGGCGCTGCG CGGCATCACC CGCGACGAAG TGCTGGCGGA TTTCGGCGGA 
GCGCAGTTCT CCAGCTTCAA GCCGGCTCTG GTCGATCTCG CCGTCGAAAC GCTGGCGCCG 
ATCGGTGCCG AGATGAAGCG GCTCGTCGCC GATCCGGCCT ATATCGATTC CGTTCTCGGA 
GACGGCGCGA GCCGGGCCGA GGCGATCGCG GCGCCGACGC TGGATGCGGT CAAGGACATC 
GTCGGCTTCG TCCGGCGCGG GCCGGCGCTC AGGGCGGTTT AG

Protein sequence

MAAFTELVFS GVQPTGNLHL GNYLGAIKRF VEMQARDAQC LYCVVDLHAI TMWQDPEALK 
GQIREVTAAF LAAGIDPKRS IVFNQSQVPQ HAELAWIFNC VARLGWLNRM TQFKDKAGKD 
RENASIGLYD YPVLMAADIL AYRATHVPVG EDQKQHLELT RDIAQKFNND FAGSILAHGH 
GEQFFPITEP LIGGPAARVM SLRDGTKKMS KSDPSEYSRI ALTDDADAIA QKVRKAKTDP 
EPLPSEVAGL AGRPEADNLV GIFAALRGIT RDEVLADFGG AQFSSFKPAL VDLAVETLAP 
IGAEMKRLVA DPAYIDSVLG DGASRAEAIA APTLDAVKDI VGFVRRGPAL RAV