Gene ECH_1116 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_1116
Symbol
ID	3927017
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	+
Start bp	1140567
End bp	1141772
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	30%
IMG OID	637902230
Product	polyA polymerase/tRNA nucleotidyltransferase family protein
Protein accession	YP_507900
Protein GI	88657671
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0617] tRNA nucleotidyltransferase/poly(A) polymerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.172722
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACGATG ACTTTATAAA TAATGAGAAT ATTCTGTTAA TCATAAATGC AATAAAAAAA 
TTTCAAGGAG ATATTAGGTT AGTAGGTGGA TGTGTAAGAG ATAGTCTTCT AAAAAGACAG 
ACCATAGATA TTGATTTTGC AACTACTTTA TTACCCAACC AAACAATAAA TGCTCTTACT 
GCAGCTCATA TTAAAGCTAT TCCAACAGGT ATAAAACATG GTACAATAAC AGCCTTAGTT 
AATAATACAG CATATGAAAT TACAACACTA AGATCTGATA TTAGCTGTGA TGGAAGACAT 
GCTGAAGTAA AATTTACAAA CAATTGGCAG CAAGACGCTT CAAGAAGAGA TTTCACCTTC 
AATGCTCTAT ATTGTGATGA AAAAGGAATA GTATATGATT ATTTTTCTGG TATCCAAGAT 
CTAGAAAAAA AACATCTAAA TTTTATTGGA GATCCAGAAA TTAGAATACA AGAAGACTAC 
CTACGCATAC TTCGAGCATT TAGATTTTAT GCTTCTATAT GTAGTCAAAA CAAATTGAGT 
GATGAAATAG TGCACTCTTG CACAAAATAT TCATCTTATA TCAATAACCT ATCCAGAGAA 
CGCATTCGCG ATGAGTTCTT TAAACTTTTA TTATGTCCTA ACTTATCAAA CACATTAAAG 
ATTATGCAAA AATGCCACGT GCTAGATAAA ATCATTCCCT TTGAAGTCAT ACCAGACATA 
ATGTCATCTG AGACCTTATC AAACACAGAT CCACTAACAA AATTAGCAGC TCTTTTAAGA 
ACAAACAATA ACAACCACTC TCTAGATAAA ATTAAAGCTT CTTTATGCTT ATCAAACTAC 
AGTCAAAAAA CACTTGTGTC ACTATTAAAC AATAATTTAG AACTTCCACT TTCAACTACC 
GCACAACACA AACACATTAA CAAGCTTGGA AAAGAAATAT ACTGCAATCT ACTGAGAATA 
ATACATGCAG AATTAAATTT AAATTATCAT GACCTAATGC AATATATAGA GTACGCAGAT 
CAATTAATTA TTCCTGAATT TCCTATCTCT GGAAAAGATT TACTTAATAT AGGATACCAA 
CCAGGAAAAA ATCTTGGTAT CACTTTAGAA AAAATCAAAG ATCTATGGGA AAATAGTTCA 
TATCAACTAA CAAAAACCCA ATTATTAGAT TACGCGAGAG GAAAATTATT AAAAAGTAAG 
AATTAA

Protein sequence

MYDDFINNEN ILLIINAIKK FQGDIRLVGG CVRDSLLKRQ TIDIDFATTL LPNQTINALT 
AAHIKAIPTG IKHGTITALV NNTAYEITTL RSDISCDGRH AEVKFTNNWQ QDASRRDFTF 
NALYCDEKGI VYDYFSGIQD LEKKHLNFIG DPEIRIQEDY LRILRAFRFY ASICSQNKLS 
DEIVHSCTKY SSYINNLSRE RIRDEFFKLL LCPNLSNTLK IMQKCHVLDK IIPFEVIPDI 
MSSETLSNTD PLTKLAALLR TNNNNHSLDK IKASLCLSNY SQKTLVSLLN NNLELPLSTT 
AQHKHINKLG KEIYCNLLRI IHAELNLNYH DLMQYIEYAD QLIIPEFPIS GKDLLNIGYQ 
PGKNLGITLE KIKDLWENSS YQLTKTQLLD YARGKLLKSK N