Gene ECH_0502 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_0502
Symbol	ispH
ID	3927316
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	-
Start bp	503528
End bp	504487
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	30%
IMG OID	637901625
Product	4-hydroxy-3-methylbut-2-enyl diphosphate reductase
Protein accession	YP_507317
Protein GI	88658611
COG category	[I] Lipid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0761] Penicillin tolerance protein
TIGRFAM ID	[TIGR00216] (E)-4-hydroxy-3-methyl-but-2-enyl pyrophosphate reductase (IPP and DMAPP forming)

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCATCAAA ATTTAAAAAA AAATGTTGAA GTGATACTTG CTAATCCAAG AGGATTTTGT 
GCGGGAGTTT CTAGAGCAAT AGAAATCGTA AAGCTAGCAG TAAAATACCA TAGTGACAAT 
AGAAAAGTTT ACGTACTACA TGAAATTGTA CACAATAAAT ATATAATTAA TTCCTTAAAG 
GAAATGGGTG TAATTTTTAT AGATACATTA GATCAAGCTG AAGATGGATC AATATTAATA 
TATAGTGCAC ACGGTATTTC AAAAGAAATA GAACACCTAG GACAATCATG CAACTTAGAG 
ATTATTGATG CAACATGTCC ATTAGTAAAT AAAGTACATA AGGAAGTGCA AGCTTATGAT 
AAAAAAGGAT ATCAAATAAT TTTAATAGGC CATAAAGGGC ATCGTGAAGT CGAAGGTACT 
ATGGGACAAA TAACCAACCC TGTACTATTA GTACAAAACC TATCTGACAT TGATAATATA 
GAAGTAACAA ATTCAGATAA ACTTGCATAT GTTACACAAA CAACTTTAAG TGTAGATGAC 
ACAAAAGAAA TAATCAACAA ACTAAAACAA AAATTCCCAA ATATTAAAGG GCCAGATTTA 
AAGGATATCT GTTATGCTAC TCAAAATAGG CAAACTGCTG TAAAACAATT ATCAGAATTA 
GTAGATATCA TATTCGTATT AGGAAGCAAG AATAGTTCAA ATTCAAATCG TTTAAAAGAA 
CTAGCTGAAT TAAAAACTCC TGCTTTTTTA ATAGATTCTT ATCAGGAAAT TAACTTAGAT 
ATTTTAAAAG ATGTAAACAA AATAGGAATA ACTGCAGGAG CATCAGCCCC AGAAATACTA 
ATCACAGAAG TAATAGATTT ACTGAAACAG CACATGAATA TCAAGTTATC AGATTTAGAA 
GTTATAAGAG AGAACGTTGC ATTCAATATA CCAAAACAAT TAAGAGAATA CAAACTATAA

Protein sequence

MHQNLKKNVE VILANPRGFC AGVSRAIEIV KLAVKYHSDN RKVYVLHEIV HNKYIINSLK 
EMGVIFIDTL DQAEDGSILI YSAHGISKEI EHLGQSCNLE IIDATCPLVN KVHKEVQAYD 
KKGYQIILIG HKGHREVEGT MGQITNPVLL VQNLSDIDNI EVTNSDKLAY VTQTTLSVDD 
TKEIINKLKQ KFPNIKGPDL KDICYATQNR QTAVKQLSEL VDIIFVLGSK NSSNSNRLKE 
LAELKTPAFL IDSYQEINLD ILKDVNKIGI TAGASAPEIL ITEVIDLLKQ HMNIKLSDLE 
VIRENVAFNI PKQLREYKL