Gene ECH74115_3879 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3879
Symbol
ID	6969705
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3588360
End bp	3590213
Gene Length	1854 bp
Protein Length	617 aa
Translation table	11
GC content	55%
IMG OID	643387657
Product	hypothetical protein
Protein accession	YP_002272106
Protein GI	209399258
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATTTA AACATTATGA TGTTGTCAGG GCGGCGTCGC CGTCAGACCT TGCGGAAAAG 
CTGACACACA AACTGAAAGA GGGCTGGCAG CCGTTTGGTA GTCCGGTGGC CATAACCCCT 
TATACCCTGA TGCAGGTGAT TACAGCAGAA GGTGATGTGG TGGTCAGTGG TGCAACTGAG 
CCGGATTGGT ACTACGTCAT CGTACTGGCC GGGCAGTCCA ATGCCATGGC TTACGGTGAA 
GGGCTTCCGC TGCCGGATTC ATACGATGCT CCGGATCCGC GCATTAAACA GCTGGCGCGC 
CGCAGTACAG TTACGCCGGG TGGGGCTGCC TGCAGATATA ACGATATTAT TCCGGCCGAC 
CACTGCCTGC ATGATGTGCA GGATATGAGT ACGCTGAATC ATCCGAAGGC AGACCTGAGC 
AAAGGGCAGT ACGGCTGTGT CGGCCAGGGC TTACATATTG CCAAAAAACT GCTTCCGTAT 
ATCCCGAATA ACGCGGGGAT CCTGCTGGTA CCATGCTGTC GTGGTGGTTC GGCATTCACC 
CAGGGCGCGG AGGGGACATT CAGTGCGGAC GCGGGGGCCA GCCAGGATTC GGCGCGCTGG 
GGTGTGGGTA AACCGTTATA TCAGGACCTG ATTGCGCGCA CTAAAGCTGC ATTACAGAAG 
AACCCGAAAA ATGTGTTGCT GGCGGTGTGC TGGATGCAGG GAGAGTTTGA CATGAGCGCC 
GCCACCCACG CACAGCAACC TGCGCTGTTT ACAGCCATGC TGGCACAGTT TCGTGCTGAC 
CTCTCCGTGT TTAACGCGCA GTGCCATGGT GGCAGTGCTG CAGATGTGCC GTGGATTTGT 
GGTGACACGA CGTATTACTG GAAAAATACC TACGGCACCC AGTACAACAC CATTTACGGG 
GCGTACAAAA ACAGGGAGAG TGAGGGCGTT TATTTTGTGC CCTTCATGAC AGACGGTAAC 
GGCGTCAATA CCGCCACTAA CGCGCCGGCA GAAGATCCGG ATATTCCGGC ATCAGGATAT 
TACGGTGCGG CATCGAGAAC GAATGGAAAC CAGGTATCAT CAAACCGCCC GACACATTTC 
AGTTCATGGG CGCGCAGGAG CATTATTCCG GATCGTATGG CAACCGCTAT TCTGAACGCA 
GCCGGGCGCA CCTCAGCCTT CATCAGTGGT AAGGCACCGG AAATCAAACC CTCGCCCGGC 
GGCAACACGC CATCGGGTCC GTCTGCAGAT ACGTCCGTTC GCACAATCTC CCTGCTGCCG 
GCAGCCGGAG AGGCTGCTGC GCAGGGCTGG AGCATTAAGG ATGGCGGAAT TCAGTTGTCA 
GATGGTGTAT TTAAGATCAC CAAGCAGAGC AATAAAACCT GGTCCCTGAC GCATCCGGTG 
GATGACGCAA TTACCCTGCT GACACAGGGC GGCAGACTGA CCTGTAAGTT CCGCCTGTCA 
GGCGCACTGA CCAACAATCA GTTCGGGCTG GGGATTTATC TGTATACGGA TGCTCCCGTT 
CCTGATGGTG TGGCGATGAC GGGTACCGGT AATCCGTTCC TGATGTCGTA CTTCACTCAG 
ACCACTGACG GCAGAGTGAA TCTGATGCAT CACAGGAAAG CCGGAAACAC GAAGCTGGGG 
GAGTTCGGCG ATTACGGTAA CGACTGGCAG ACGCTGGAGC TGGTGTTCAC CGCCGGCAGT 
GCCACGGTTA CTCCGAAACT GAATGGAGTG GCTGGCCCGG CATTCCAGGT TATAAAAGAC 
AGTATGACAC TGGGACTGAA TGCGCTGACG CTGACGGATG TTACAAAAAA TGCAGCGTAT 
GGCGTTGAGA TAGAAAGTCT GGTGCTGGAG ATAAATGCAC CGGCATCATC ATAA

Protein sequence

MTFKHYDVVR AASPSDLAEK LTHKLKEGWQ PFGSPVAITP YTLMQVITAE GDVVVSGATE 
PDWYYVIVLA GQSNAMAYGE GLPLPDSYDA PDPRIKQLAR RSTVTPGGAA CRYNDIIPAD 
HCLHDVQDMS TLNHPKADLS KGQYGCVGQG LHIAKKLLPY IPNNAGILLV PCCRGGSAFT 
QGAEGTFSAD AGASQDSARW GVGKPLYQDL IARTKAALQK NPKNVLLAVC WMQGEFDMSA 
ATHAQQPALF TAMLAQFRAD LSVFNAQCHG GSAADVPWIC GDTTYYWKNT YGTQYNTIYG 
AYKNRESEGV YFVPFMTDGN GVNTATNAPA EDPDIPASGY YGAASRTNGN QVSSNRPTHF 
SSWARRSIIP DRMATAILNA AGRTSAFISG KAPEIKPSPG GNTPSGPSAD TSVRTISLLP 
AAGEAAAQGW SIKDGGIQLS DGVFKITKQS NKTWSLTHPV DDAITLLTQG GRLTCKFRLS 
GALTNNQFGL GIYLYTDAPV PDGVAMTGTG NPFLMSYFTQ TTDGRVNLMH HRKAGNTKLG 
EFGDYGNDWQ TLELVFTAGS ATVTPKLNGV AGPAFQVIKD SMTLGLNALT LTDVTKNAAY 
GVEIESLVLE INAPASS