Gene ECH_0888 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_0888
Symbol
ID	3927343
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	+
Start bp	912875
End bp	914020
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	35%
IMG OID	637902005
Product	hypothetical protein
Protein accession	YP_507683
Protein GI	88658233
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.125506
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTACTAT TAAAGCACAC TTTTGTGTTG TACACCACTC AGTGGCTATT TCATCTACTT 
TTTAAGTTAA CATGGTACAG GGCTATGATA GTAGGACAAA ACAATCAAGG GGGTTCTTGC 
GCAGGATCAG ATGAATATCA ACCACTAAAC ACAGATCCAC TTCCAAATGA CGATACATCA 
ACAGTAGAAT ATAATGAGTT TTCCCCTCTA TTAAGGTCAG AAGAAGATGA AACACCAGAT 
AAGGCAAATG ATGAAATACT GAATAAGATA GATTTTGATA GATATTTTGT AATTTTTTCT 
TTCATTGGGT TATTAGCAGA AGCAGCGTCT TCTATATTCA ATTTAGTATC AACCCAAGTT 
TTTATTCCTA CTAGCACTAA ACATGCAGTA GCTACTGCTT TTTATGCTCT CTGTATACTA 
ATTGCAATTT CCATGATTGT AAGTTCAATA CTTGCAATAA AGAAATCACT CAACCAAAAA 
AAGCATCTTG ACGATATGCC AACAGATGCA TCAAATGAAG AATGTGTAGA AGAGAACGCC 
AAATATAAAA AATTAAAAAA AATACAGGCT CATGCTCAAG TTTCTGAAAA TGCTCTTACT 
ATCATTTCAC AGGTGATGTG GCTTATTGTT TATATTGCAT CACTAGTAAT GATATCTATG 
GGTGACAACC AAATACTTGA AAACATGAGC CTGTTTTTAT CGATTACTGC ATCTCTTTTA 
GGTATTATAT CTTGTGTTAT AAGGTTAATA GATGCAAATA TATCACGTAA GACATCTGGT 
TCTGAGGAAG AAAAAAAACA ACACCTTAGT TTCACAATTT TTTGCGGTAT CATCTTAGCT 
TTTGAGATAA TTCATTGTGC ATGCCATATA TCAGAAGCAA TATCTCTTGG TGGAAAAATG 
CACAATCTTT ATGACTTTCA GAATATTCCT ATACTCTGTT TCGAACTGAT AACAGTAGCT 
ATGTTTATTG CATCATTCTT CATAGAACAG TGCATTAAAA GTAAAGGAGG AAAGCACCAG 
ACCAATGATG ATGGTGTTGC CGCTGCCGCT TGTTGCGGTG ATAATCTCCA TCCTAGTAGC 
TTATTAGCTG ATGATAGTGG TGGTAATATT GCCAGACTTA TAGTAGCACA AGAACTATCA 
GCTTAA

Protein sequence

MVLLKHTFVL YTTQWLFHLL FKLTWYRAMI VGQNNQGGSC AGSDEYQPLN TDPLPNDDTS 
TVEYNEFSPL LRSEEDETPD KANDEILNKI DFDRYFVIFS FIGLLAEAAS SIFNLVSTQV 
FIPTSTKHAV ATAFYALCIL IAISMIVSSI LAIKKSLNQK KHLDDMPTDA SNEECVEENA 
KYKKLKKIQA HAQVSENALT IISQVMWLIV YIASLVMISM GDNQILENMS LFLSITASLL 
GIISCVIRLI DANISRKTSG SEEEKKQHLS FTIFCGIILA FEIIHCACHI SEAISLGGKM 
HNLYDFQNIP ILCFELITVA MFIASFFIEQ CIKSKGGKHQ TNDDGVAAAA CCGDNLHPSS 
LLADDSGGNI ARLIVAQELS A