Gene ECH_1000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_1000
Symbol	metG
ID	3927157
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	-
Start bp	1024001
End bp	1025521
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	33%
IMG OID	637902116
Product	methionyl-tRNA synthetase
Protein accession	YP_507787
Protein GI	88657921
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0143] Methionyl-tRNA synthetase
TIGRFAM ID	[TIGR00398] methionyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAATA TATATATTAC TACTCCTATT TATTATGTTA ATGATGTGCC ACATATAGGT 
CATGTTTATA CAACTTTGAT ATCTGATATT ATCGCACGGT TTATGCGTCT TGATGGACAT 
AGTGTAAAGT TTATAACTGG AACAGATGAA CATGGGCAAA AAATAGAAAA AGCAGCCCAA 
GAACGTAACA TGTCATTATT AGATTTTACT GATAATACAA GTGCTGTTTT TAGACAGTTA 
GCTGATGTTA TGAACTATAG CTATGATGAT TTTATTCGTA CGACAGAAAC AAGGCACAAA 
AAGACTGTGG TAGCTTTATG GCAGCGTTTG TGTGATAATG GGGCAATATA TTTAGGTAGT 
TATTCTGGTT GGTATTCGGT AAGAGATGAA ACGTTTTATC AGGAGAAAGA ATTGGTCGAT 
GGTAAAGCTC CTACAGGAGC TGATGTAGAA TGGATAGAAG AGCCGAGTTA TTTTTTTCGA 
TTGTCAAATT TTCAGGAAAG GTTGTTAGCT TTTTACGAGG AAAATCCTGA TTTTGTTATT 
CCTAAATATC GGTATAATGA AGTTATATCA TTTGTTAAAT CAGGGTTGAA AGATCTTTCT 
GTATCAAGAC AAAATGTTTT ATGGGGAATA AAAGTACCAA ATGATGATAA ACATGTAATT 
TATGTTTGGG TAGATGCTTT AGCAAATTAC TTGACAGTAT TAGGGTTTCC TGATGAGAAC 
CATAAAGATT ATCAAGCTTA TTGGGCAAGT GATAGTAGTT CTGTTTTACA GGTTGTGGGT 
AAGGATATAT TGAGGTTTCA TGCTGTATAT TGGCCTGCTA TTTTAATGGC AGCTGAATTG 
CCTTTACCTA AAAAAATCTT GGCACATGGT TGGTGGACTA ATGAGGGGCA AAAAATTTCT 
AAGTCGTTAG GTAATGTTAT TAAACCTTTT GACCTAGTAG AAGAATTTGG AGTTGATCAA 
TTAAGATATT TTTTAATTAA AGAAATGCCA ATAGGGAACG ATGGAGATTT TAAAAGAAAT 
AGTCTTATTA ATTGTATAAA TTATGATTTA GCAAATAATA TAGGGAACCT TGTACAAAGA 
ACTGTTTCAC TATTGTATAA AGAATGTGGA GGGATAGTAC CAACAGTAAG TGGCAATTTG 
CTGCAGGGTG AGGAAGTATT ACCAGATTAT CAAGAGATTC TTGAAAAGGT TAGAGATTGT 
GTAATGCGTT GTAATCTGAA TGAGATGATA CATATTATAG AGCAATTATC TTCTGCAGCT 
AATGAATATA TTGCATCACG AGCGCCATGG AGGTTATCTA AGAGTGACCC TAAAATTATG 
GAAGCAGTAT TGTATAAATT ACTTGAATAT ATTAAATGTA TAGGGTTGCT GTTGCAACCT 
GTCATGCCTA AATTATCATC TAAAATATTA GATCAAATTG GTTTACCAGA ATGTAATCGT 
GACTTTAGTC GATTTTCTAT ACCTATAAAT ATGAATACAG TTTTACCAAA ACCAGAGCCT 
ATTTTTGCAA AAATCTTATG A

Protein sequence

MNNIYITTPI YYVNDVPHIG HVYTTLISDI IARFMRLDGH SVKFITGTDE HGQKIEKAAQ 
ERNMSLLDFT DNTSAVFRQL ADVMNYSYDD FIRTTETRHK KTVVALWQRL CDNGAIYLGS 
YSGWYSVRDE TFYQEKELVD GKAPTGADVE WIEEPSYFFR LSNFQERLLA FYEENPDFVI 
PKYRYNEVIS FVKSGLKDLS VSRQNVLWGI KVPNDDKHVI YVWVDALANY LTVLGFPDEN 
HKDYQAYWAS DSSSVLQVVG KDILRFHAVY WPAILMAAEL PLPKKILAHG WWTNEGQKIS 
KSLGNVIKPF DLVEEFGVDQ LRYFLIKEMP IGNDGDFKRN SLINCINYDL ANNIGNLVQR 
TVSLLYKECG GIVPTVSGNL LQGEEVLPDY QEILEKVRDC VMRCNLNEMI HIIEQLSSAA 
NEYIASRAPW RLSKSDPKIM EAVLYKLLEY IKCIGLLLQP VMPKLSSKIL DQIGLPECNR 
DFSRFSIPIN MNTVLPKPEP IFAKIL