Gene ECH_0167 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_0167
Symbol	trpS
ID	3927136
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	-
Start bp	156239
End bp	157240
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	31%
IMG OID	637901291
Product	tryptophanyl-tRNA synthetase
Protein accession	YP_506992
Protein GI	88658497
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0180] Tryptophanyl-tRNA synthetase
TIGRFAM ID	[TIGR00233] tryptophanyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTATAC CTATTGTTTT ATCTGGTATA CAACCAAGCG GTGGTATACA TCTTGGAAAC 
TACTTAGGTT CTATACGTAA TTGGGTGTCT TTGCAAAGTT CATATAAGTG CTTTTTTTTT 
CTTGCTGATT TACATACCTT AACATCTAAT AATTATAATT CAGCTGAATT AAAGCAAAAT 
TCTATAAACA CATTAGCAAC ATATTTAGCA TGTGGTATTG ACCCAAATAA ATCAGTTTTA 
TTCGTTCAAT CATCCATCCA TGCACATGCA GAATTGTTAT GGATATTTAG TTGTATTACT 
TCAACAGGGC AATTAAATAG AATGACTCAA TTTAAAGAAA AAAGCCGTAA CAAAGTATCA 
ACAGCTTGTT TAGGTCTATA CAGCTATCCA GTATTAATGG CTGCGGATAT ATTAATATAC 
AAAGCAAATA TTGTACCAGT AGGTATTGAC CAAAAACAAC ATCTCGAGCT AACTAGGGAT 
ATTGCTATGA ATTTTAATTC TACATATAAC ACGCAATATT TTCAAATCCC AGAACCATTG 
ATTATGCAGG AGTCAGCAAA GATTATGAAT CTGAGGAATG GAAAGAAAAA AATGAGTAAA 
TCTGACTCAT CGGATTACAC TCGTATTAAC TTATATGATA GTAACGATGT AATTTCAAAA 
AAAATAAGCA AAGCAACCAC TGATTCTATA GTAGGATTCA ATTTTAGTAC TTTAGATAGT 
AGGCCTGAAG TTAAAAACCT TGTTAGCATA TATGCTACAC TTTTAAACAT CAATATAGAA 
CAAGCATGCA CTAACATTGA AAATTTCAGT ACAAAACAAT TCAAGGAACA ATTAACAGAA 
TTACTCATTG ATAATATCGC TCCAATACGA CATAAAGTAA CAGAATTCCT TGAAGATAAA 
GAACATCTTC ATAACATAAT AGTATCAGGT AACAATAAAG CAGCATCTAT TGCTAATAAG 
CACATATTAG AAATAAAAGA AATCATAGGG TGTTGGTCAT AA

Protein sequence

MSIPIVLSGI QPSGGIHLGN YLGSIRNWVS LQSSYKCFFF LADLHTLTSN NYNSAELKQN 
SINTLATYLA CGIDPNKSVL FVQSSIHAHA ELLWIFSCIT STGQLNRMTQ FKEKSRNKVS 
TACLGLYSYP VLMAADILIY KANIVPVGID QKQHLELTRD IAMNFNSTYN TQYFQIPEPL 
IMQESAKIMN LRNGKKKMSK SDSSDYTRIN LYDSNDVISK KISKATTDSI VGFNFSTLDS 
RPEVKNLVSI YATLLNINIE QACTNIENFS TKQFKEQLTE LLIDNIAPIR HKVTEFLEDK 
EHLHNIIVSG NNKAASIANK HILEIKEIIG CWS