Gene Meso_4035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Meso_4035
Symbol
ID	4182833
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chelativorans sp. BNC1
Kingdom	Bacteria
Replicon accession	NC_008254
Strand	+
Start bp	4344265
End bp	4345332
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	59%
IMG OID	638069931
Product	tryptophanyl-tRNA synthetase
Protein accession	YP_676567
Protein GI	110636359
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0180] Tryptophanyl-tRNA synthetase
TIGRFAM ID	[TIGR00233] tryptophanyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGAAT TCAAGCAGCT CGTTTTTTCC GGAGTGCAGC CCACCGGCAA TCTCCATCTC 
GGCAATTATC TAGGCGCATT GCAAAAGTTC GTCGCCCTGC AGGATAGCTA CGAATGCATC 
TACTGCGTTG TGGATATGCA TTCACTGACG GCCACGCTGG TTCACGACGA TCTCATCGAC 
CAAACGCGGG GGATCGCCGC GGCCTATCTC GCCTGCGGAC TCGATCCCAA GAAAAACATC 
ATCTTCAACC AAGCCCGCGT GCCGCAACAT GCGGAGCTTG CCTGGATATT CAACTGCGTC 
GCCCGCATTG GCTGGATGAA CCGCATGACG CAGTTCAAGG ACAAGGCAGG CAAGGACCGC 
GAGAATGCCT CGCTCGGCCT TCTCGCCTAT CCGAGCCTGA TGGCCGCTGA CATACTTCTT 
TACCGCGCCA CCCATGTGCC CGTCGGCGAG GACCAGAAGC AGCATCTGGA ATTGACCCGC 
GACATCGCCC AGAAGTTCAA TAACGACTTC TCCGAGAAAA TCGCAAATCT CGGCTACGGC 
GTCGAAATGA CGGTGGGCGA GGAGAAGGTG AACGGCTTTT TCCCGCTGAC GGAGCCGCTT 
ATCGAGGGGC CTGCGCCGCG CGTGATGAGC CTGCGCGACG GCTCCAAGAA GATGTCTAAA 
TCCGATCCAT CGGACCTCTC GCGCATCAAT CTCCTGGACG ATGCTGACAC GATCGCGCGC 
AAGATCAGGA AGGCAAAGAC TGATCCGGAA CCGTTGCCGG GCGATGTCGA AGGTTTCGCC 
GGACGTCCGG AGGCCGATAA TCTGGTGGGC ATCTACGCCG CACTTGCCGG CATGCCGCGG 
GAAAACGTAA TCGCCGAGTT TGGCGGACGC CAGTTCTCCG ATTTCAAACC CGCACTTGCG 
GATCTTGCCG TGGAGAAGCT CGCGCCTATC GGCGGGGAGA TGCGACGCCT CAAGGCCGAT 
CCGGCCTACA TCGACAATGT TCTCAGGGAT GGCGGCGAGC GTGCGTCCGT CAAGGCTGAG 
GCGACCATGA AGCATGTGCA CGAAATTATC GGTCTGCTGG TGAACTGA

Protein sequence

MSEFKQLVFS GVQPTGNLHL GNYLGALQKF VALQDSYECI YCVVDMHSLT ATLVHDDLID 
QTRGIAAAYL ACGLDPKKNI IFNQARVPQH AELAWIFNCV ARIGWMNRMT QFKDKAGKDR 
ENASLGLLAY PSLMAADILL YRATHVPVGE DQKQHLELTR DIAQKFNNDF SEKIANLGYG 
VEMTVGEEKV NGFFPLTEPL IEGPAPRVMS LRDGSKKMSK SDPSDLSRIN LLDDADTIAR 
KIRKAKTDPE PLPGDVEGFA GRPEADNLVG IYAALAGMPR ENVIAEFGGR QFSDFKPALA 
DLAVEKLAPI GGEMRRLKAD PAYIDNVLRD GGERASVKAE ATMKHVHEII GLLVN