Gene ECH_1070 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_1070
Symbol
ID	3927910
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	+
Start bp	1098742
End bp	1099884
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	34%
IMG OID	637902184
Product	putative membrane-associated zinc metalloprotease
Protein accession	YP_507855
Protein GI	88658328
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0750] Predicted membrane-associated Zn-dependent proteases 1
TIGRFAM ID	[TIGR00054] RIP metalloprotease RseP

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAGTA TTATTGATAA CTTATATCAT GTACTCAATA ATGGTTCATT TTATTTGCTG 
TCGTTTCTCA TTATAATGTC TATTATAGTT TTCGTACATG AATACGGTCA TTATATTGTT 
GCAAAATTAT GCAATGTGAA GGTTGAAGTT TTTTCTATAG GATTTGGCCC AGAGTTATTT 
GGAATTAACG ATAAGTCTGG CACAAGGTGG AAGTTCAGCG TGATACCAAT AGGTGGGTAT 
GTAAAGATGT TAGGGGATGA AGACCCAGCA AGTGTTGAAG CAAATCCTAA CCGTTTGTCA 
GAAGAAGATA AGTTACTTGC ATTTTGTGAA AAACCTCTAT ACCAAAAATT TCTTATTGTA 
TTTGCTGGAC CATTCGCAAA TTTAGTGTTT GCTATAGTAG TACTCATGAT GTTCTTCACT 
ACTAAAGGAA TGATGAAGCA CAACTCTGTC ATTGGAGGCG TAGTACAAGA TAGTGCAGCA 
CAACATGCAG GATTAGCTTC AGGGGATACA ATTCTAAAAA TCAACGACTA CCAGGTTAAA 
TGGTTTGAAG AAATTAAACA GTATATAGAA AAATATGCAA AAGATAATCA AGAGCTAACT 
ATAGAATATG CACGTGACGG GCACATTCAT GTTGTGAAAG TTAAACCAAG CATTAAGGAA 
GAAAAAGGAC TTTTTGGAAG CATAAAGAAA AGTCCATTTT TAGGAGTTAC AATGAGTAAT 
GTACTCAGCA ATTATGAATT TCAGAGATTA AGCATCACTA GTGCTTTTGT TCAGTCCATT 
AATTACACTT ATTTACTGTC AAAGTCAATT TTTCAAGTAT TGGGACAAAT GTTGGTAGGG 
AAACGCAGTA TTTCTGAGTT AGGTGGTCCT ATACGCATTG CTCAATATTC TGGAGAATCA 
GTAAAACACA ACGAAGTACT ATTGTGCATG GCAATGATTT CCATTAACCT AGGTGTAATG 
AATTTATTAC CAATTCCTAT GCTAGATGGT GGACATATTT TCCAATATTT TGTCCAAGCT 
ATATTACGAC GCAAACAACT CAATCCTAAA TATCAGCGGT ATATATCTAC AATTGGGTTA 
ATGCTTCTGC TATCTTTAAT GATTTTTGTC ACGTTTAACG ATATAAAAAG TATGTTTAAG 
TAG

Protein sequence

MASIIDNLYH VLNNGSFYLL SFLIIMSIIV FVHEYGHYIV AKLCNVKVEV FSIGFGPELF 
GINDKSGTRW KFSVIPIGGY VKMLGDEDPA SVEANPNRLS EEDKLLAFCE KPLYQKFLIV 
FAGPFANLVF AIVVLMMFFT TKGMMKHNSV IGGVVQDSAA QHAGLASGDT ILKINDYQVK 
WFEEIKQYIE KYAKDNQELT IEYARDGHIH VVKVKPSIKE EKGLFGSIKK SPFLGVTMSN 
VLSNYEFQRL SITSAFVQSI NYTYLLSKSI FQVLGQMLVG KRSISELGGP IRIAQYSGES 
VKHNEVLLCM AMISINLGVM NLLPIPMLDG GHIFQYFVQA ILRRKQLNPK YQRYISTIGL 
MLLLSLMIFV TFNDIKSMFK