Gene ECH_0883 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_0883
Symbol
ID	3927519
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	+
Start bp	905243
End bp	906370
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	31%
IMG OID	637902000
Product	putative DNA processing protein DprA
Protein accession	YP_507678
Protein GI	88657722
COG category	[L] Replication, recombination and repair [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0758] Predicted Rossmann fold nucleotide-binding protein involved in DNA uptake
TIGRFAM ID	[TIGR00732] DNA protecting protein DprA

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.430936
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATCA ATAAAGAATT ATCCCACCAA GAACTGATAT CATGTCTTAG AGTAATAAGA 
ACACCAAACA TAGGTCCATC AACATTTCAT GCATTAATTA AGCTATATAA AACTTGTCAA 
CATATACTGG AAGTTCTACC AAACTTAATA AAAAAATCTA AAATTAATAA TAAAATTCAC 
AACATATGCT CTATTGAAGC AGCAGAACTA GAAATTGAAA ATACTACTAA GATTGGTGGA 
AAAATAATTA CTGTATTTGA TGAAGACTAC CCAGAAATTT TACGTAATAT TCACGATTAT 
CCACCAGTTA TAACAGTACT AGGAGACTCA TCACTGTTAA AAGAAAAAAC AATAGGAATA 
GTAGGAAGCA GGAACCCTTC CATCAATGGA AAAAATTTTG CTTATAAGTT ATCATACGAA 
TTAGCTAACT CTGGTTTTGT TATAGCGTCC GGATTAGCAA GAGGAATAGA TAAATCTGCA 
CATAGTATAA TTTACCAACA ATTACCAACA ATTGCTGTCA TGGCCAGCGG AGTCAACATA 
GTATACCCGC AGGAAAATAT ACATTTATAT AACACCATAG TAGATAAAGG AGGATTAATA 
ATCACGGAAT TTCCTTTTTC TACATTACCA AGGGCTCAAT TATTTCCACA ACGTAATCGT 
ATAATTTCTG GATTATCACT TGGAGTAGTA ATTGTCGAAG CATCTATACA ATCAGGATCA 
CTTATTACAG CAAATTTCGC TTTAGAACAA AATAGAGAAG TATTTGCAGT TCCTGGGTCA 
CCACTTGACC ATAGGTGTAG AGGAAGTAAC AGTCTAATAA AAAACGGAGC AAAATTAGTA 
GAATTTACAC ACGATATCAC AGAAAGTTTA CAATTTAACA ATAATAAACC TTACATACAA 
CAATCAATAT TCGATAATAC AACAAAAAGT GATAATAACC TTTTTGAAAT CAATAATGCA 
AAAGATACTA TTCTGCAATA CATAACCCAT AGTCCAACCG AAATTGAAGA AATCATTGCG 
TCTACTAATT TGAACATCAG TAGTATATTA ATAGCCTTAA TTGAGCTAGA AGCAGCACAA 
AAAATAGAAA GATTTCCTAA CAATAAAGTA GCTTTAATGC ACTACTAG

Protein sequence

MKINKELSHQ ELISCLRVIR TPNIGPSTFH ALIKLYKTCQ HILEVLPNLI KKSKINNKIH 
NICSIEAAEL EIENTTKIGG KIITVFDEDY PEILRNIHDY PPVITVLGDS SLLKEKTIGI 
VGSRNPSING KNFAYKLSYE LANSGFVIAS GLARGIDKSA HSIIYQQLPT IAVMASGVNI 
VYPQENIHLY NTIVDKGGLI ITEFPFSTLP RAQLFPQRNR IISGLSLGVV IVEASIQSGS 
LITANFALEQ NREVFAVPGS PLDHRCRGSN SLIKNGAKLV EFTHDITESL QFNNNKPYIQ 
QSIFDNTTKS DNNLFEINNA KDTILQYITH SPTEIEEIIA STNLNISSIL IALIELEAAQ 
KIERFPNNKV ALMHY