Gene ECH74115_3888 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3888
Symbol
ID	6970425
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3595841
End bp	3597055
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	38%
IMG OID	643387666
Product	hypothetical protein
Protein accession	YP_002272115
Protein GI	209399981
COG category	[S] Function unknown
COG ID	[COG5373] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACATG TTAATCAATC ATATTTCAGA TATGGCGATA AACATAAGGA TGGATGTGGT 
ATTCATGATC CAAGATATAA AAACAATCAT ACTTCAAATG ACGAAAGAAA ACATAATTCG 
CCACCTGCTC CGGTTATATC ACTTTTAAAA ATTGATGTGA AACCAAGAGG TGGTGTTAAA 
AATGCCAGAA ATATTAAAAA TGAAAATCAC AAGGATGAAA AAAAAGGTAA TGAACATCCT 
GTATCTTCAT CAAGTATTAA GCCAGTCGTT GACTATTACA TAAATAATAG CAATCATAAT 
GAACAGCTAT CAATCCCTCC ATATGGCACG CGATCTTATA AAGATACATT TCAACTTATT 
TTTTACAAAA ACAACATACG TTATTACAAA CCTGCTATTT ATTATGGTGT AGCCCAGTCT 
AATATTCGTC TGCATGAAGA TTCAGATAAA CATTGTATTA CTTTCCTCGC AAGGGATAAG 
AAAACCCAAA AACCATTTAC GCTTGAAATT GATGTTTCTG ACTGGAATAA AAGTCAGAAG 
GATGTGTTTT GGAAGGAATA TGAAAAGCAA AGGAAGGAAG CTGATAGGTA TTATAAGGGG 
CTTAAAGATA AAAGGAATGC TAAAAAATAC TTGACGGTTT TCTTTTTTGG GATGCCGGAT 
GAAAATGATA AGTTTCTATT TAAGACAAAC CACTTTAAAT TAGTATATGT GGCTTTCTTG 
GGTAAATTTG AAAGCTCATA TAATGATAGT AATTATTACA TTGAAAATGA TCTGTCTGTA 
TCATCATTGA ATGAACAACC CATTTCATTA TCTGATATAG ACCATAAAAA TCATGAATAT 
AATATTGAAA CTTCATTAGA TTTTAGTTCT CCTTTGCCAG AGCCAGAGCC AGAGCCAGAG 
CCAGAGCCAG AGCCAGAGCC AGAGCCAGAG CCAGAGCCAG AGCCAGAGCC AGAGCCAGAG 
CCAGAGCCAG AGCCAGAGCC AGAGCCAGAG CCAGAGCCAG AGCCAGAGCC AGAGCCAGAG 
CCAGAGCCAG AGCCAGAGCC AGAGCCAGAG CCAGAGCCAG AGCCAGAGCC AGAGCCAGAG 
CCAGAGCCAG AGCCAGAGCC AGAGCCAGAG CCAGAGCCAA TAAGATCCTC TTTAAAGGAA 
AATACTGAGA CTGTAGAAAT GAACAGTAAA GTTTGGGGGA GGCTGAAAAA GATAATCACT 
TTCTTTAAAA AGTGA

Protein sequence

MKHVNQSYFR YGDKHKDGCG IHDPRYKNNH TSNDERKHNS PPAPVISLLK IDVKPRGGVK 
NARNIKNENH KDEKKGNEHP VSSSSIKPVV DYYINNSNHN EQLSIPPYGT RSYKDTFQLI 
FYKNNIRYYK PAIYYGVAQS NIRLHEDSDK HCITFLARDK KTQKPFTLEI DVSDWNKSQK 
DVFWKEYEKQ RKEADRYYKG LKDKRNAKKY LTVFFFGMPD ENDKFLFKTN HFKLVYVAFL 
GKFESSYNDS NYYIENDLSV SSLNEQPISL SDIDHKNHEY NIETSLDFSS PLPEPEPEPE 
PEPEPEPEPE PEPEPEPEPE PEPEPEPEPE PEPEPEPEPE PEPEPEPEPE PEPEPEPEPE 
PEPEPEPEPE PEPIRSSLKE NTETVEMNSK VWGRLKKIIT FFKK