Gene ECH_0056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_0056
Symbol
ID	3927167
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	-
Start bp	49530
End bp	50696
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	31%
IMG OID	637901180
Product	putative exodeoxyribonuclease VII, large subunit
Protein accession	YP_506887
Protein GI	88657931
COG category	[L] Replication, recombination and repair
COG ID	[COG1570] Exonuclease VII, large subunit
TIGRFAM ID	[TIGR00237] exodeoxyribonuclease VII, large subunit

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACCAG AATTTACTGT TAGTGAAATC ACTAAAATTT TCCAAAATTT TGTACATGAA 
ACGTTTACTC ATATAAAAGT TAGAGGAGAA ATCAGCAATT TATCACAACC AAAATCTGGG 
CATACATATT TCACATTAAA AGATGATGCT GCTGTACTCA ATGCAATATG CTGGAACAAT 
ACCAAAGTTG AATTTGATTT AAAAAATGGA TTGGAAGTCA TATGCTCCGG GTTCCTAACA 
ACCTACCAAT CAAAATATCA GCTAATAACA GAAAACATGT TGCTAGCCGG AATAGGCAAC 
TTGAAAATAA TGCTTGAACA AAGAAAAGCA AAATTAGAAA AAGAAGGACT TTTTGATCAA 
TCAAACAAAA AACCTTTGCC TTTACTACCT AAAATTACAG GTGTAATCAC ATCTACTACT 
GGAGCAGTGA TTAACGACAT ACTAAACAGA GTGAAAAGCC GCTTTCCAAG TCACATAGTT 
ATATCTCCAG TATCCGTACA AGGCAATGAA TCTATCAACC AAATTATAGA TGCAATATCA 
AAACTAAACA ACGCCGATAC AAATAAACCA GACGTAATCA TTATCGCCAG AGGAGGAGGC 
AGTATAGAAG ATTTATGGAT TTTTAATGAT GAATCAATAG TAAGGGCAGT AGCTAGATCT 
AGCATTCCTA TAGTTTCTGC AATCGGTCAT GAAACTGACT TTACTTTAAT TGATTATGCA 
GCAGATGTAC GTGCTCCTAC ACCTACAGCA GCAGTAGAAA TTGTTTTGCC AACAAAAACC 
CAACTCATAG AACATATAAA CAGTAAATTC AACAAAATAA AGACAACTTT ACACTATAAA 
ATAAATAAAA AAAAAGAGAG GCTGTTTTAT TTACACAACA ACTTAATCAA AACTAAACAT 
CAAATTAAAG TACTAAAACT TCAACTATCT GAATACAAAA ACAAAATAGA AGTATTGCTA 
AAAATACTGC TATTAAATAA GAAACAATCC CTAAACGCGC TATATAATAA AATCAATAAA 
TTTAACAAAG AAAAAACTTT AGAAGCAGGA TATGCTGTAT TATACGATAC AAACCGTAAC 
CACATCAGCA GTATAAAAAA ACTAAAATCA AATGATATTA TATCAATTGA ACTAAAAGAT 
GGTATAATAG AAGCTATAAT AAAATAA

Protein sequence

MTPEFTVSEI TKIFQNFVHE TFTHIKVRGE ISNLSQPKSG HTYFTLKDDA AVLNAICWNN 
TKVEFDLKNG LEVICSGFLT TYQSKYQLIT ENMLLAGIGN LKIMLEQRKA KLEKEGLFDQ 
SNKKPLPLLP KITGVITSTT GAVINDILNR VKSRFPSHIV ISPVSVQGNE SINQIIDAIS 
KLNNADTNKP DVIIIARGGG SIEDLWIFND ESIVRAVARS SIPIVSAIGH ETDFTLIDYA 
ADVRAPTPTA AVEIVLPTKT QLIEHINSKF NKIKTTLHYK INKKKERLFY LHNNLIKTKH 
QIKVLKLQLS EYKNKIEVLL KILLLNKKQS LNALYNKINK FNKEKTLEAG YAVLYDTNRN 
HISSIKKLKS NDIISIELKD GIIEAIIK