Gene ECH_0189 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_0189
Symbol
ID	3927670
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	+
Start bp	181597
End bp	182637
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	34%
IMG OID	637901313
Product	putative iron-binding protein
Protein accession	YP_507013
Protein GI	88658650
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.120226
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGATTAA TTGCTTGTCT TGGTATTATA GCTGTTGTTA TCCTAGCCTT TAGTTTTTTT 
ACTAAAAAGC AGCAGGTTCA AGATTTAACA CAAGAAGTAC GAGTATATTC ATCTCGCAAG 
GAAGAATTAT TACATAGTTT GTTTAAACAA TTTACTAAAG AAACTGGTAT AAATGTTAAA 
TACATCAATG ACGAAGCCGC TCAACTTATT AATAGAATGG AAAATGAGGG TACTGCTACT 
TCAGCTGATG TATTTTTAAC TGCAGATGCT GTTAATCTTA TTCTTGCTAA AAAGAAAGGA 
TTGTTGCAAC CTGTTCAATC TGAAGTGTTG AATCAAGCAA TTCCTAGTAA GTATAGAGAT 
AGTGAGGGGT TTTGGTTTGG GTTAACTAAG CGTGCAAGGG TGATAGTATA TAACAAAGAT 
TTAGTTGAAA AGAGTGACTT AAGTACATAT GAGCACCTTG CAAATACAAA ATGGAAAGAT 
AAAATTTTAG TAAGATCTTC TAGCAGTCCA TATAACCAGT CTTTAATTGC TTTTATGATA 
GCAAATAATG GTATAGAAAA TACTAAGATT TGGGTTAAAG GTTTAGTTTC AAATATGGCT 
AGGAAGCCTA GTGGTGGGGA TATAGATCAA ATTTATGCTG TTGCAGCAGA TGAAGGTAGT 
ATAGCTATAG TTAATAGTTA TTATTTTGGT AGGATTGCAG CTTCTGATAA GAAGAGTGAT 
CAGATTGCAG TTAAAAAACT TGGTATCTTT TTCCCTAATC AGGAAACCAC AGGTACTATG 
ATTAACATTA GTGGTGGTGC TGTAACAAAG AATGCAAAGA ATAAGCAGAA TGCTATAAGA 
TTGTTAGAGT TTTTAACTAG CGTGAAAGCA CAAAAGGTCT ATGCTCAAGT TAATCAAGAA 
TATCCTGTTG TAGAAGGGGT AGAGCTCTCA GAGATTTTAG GGACTTTTGG TTCATTTAAG 
GAGAGCAATT TGCCTTTACA AGAATTAGAG AAACATTTGA CTGAAGCTGT TAAAATGGCA 
GATGAGTGTG GGTGGAGATA G

Protein sequence

MRLIACLGII AVVILAFSFF TKKQQVQDLT QEVRVYSSRK EELLHSLFKQ FTKETGINVK 
YINDEAAQLI NRMENEGTAT SADVFLTADA VNLILAKKKG LLQPVQSEVL NQAIPSKYRD 
SEGFWFGLTK RARVIVYNKD LVEKSDLSTY EHLANTKWKD KILVRSSSSP YNQSLIAFMI 
ANNGIENTKI WVKGLVSNMA RKPSGGDIDQ IYAVAADEGS IAIVNSYYFG RIAASDKKSD 
QIAVKKLGIF FPNQETTGTM INISGGAVTK NAKNKQNAIR LLEFLTSVKA QKVYAQVNQE 
YPVVEGVELS EILGTFGSFK ESNLPLQELE KHLTEAVKMA DECGWR