Gene ECH74115_1756 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1756
Symbol
ID	6967541
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	1686677
End bp	1687717
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	50%
IMG OID	643385707
Product	hypothetical protein
Protein accession	YP_002270199
Protein GI	209396707
COG category	[R] General function prediction only
COG ID	[COG5529] Pyocin large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000000208763
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.000309878
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGTATCG ATGCACTACG ATGGGCTAAA AAGGTGAAAA CCGGCAGTTC ATCCAGTAAG 
TCAGTATTGA CCTGGCTTGC TGATATGTGC GGTGCCGATT TGTGTGCATA CCCGTCTGTA 
TCTGCACTGG CAGAAGTAAC GGAACTGAAC AAAAAGACTG TGCAGGACAG CTTACGACAC 
CTGATGGAGA TTGGGTTAAT TGTTGATACC GGTGAGAGAA AAGGCAGAAC AAAGCAAATT 
GTGGTGTACC GACTTATCGG TGTAGAAGAA AGTGTTGCCG AGCCTGAATA CACCCAAAAA 
CGGGAGTCTT TAAAGGTGGG TAAAATTGGT GCTGTTAATA AAAACAGTAC CGAAAATGGT 
TATGTTTCAG CACAAAACAG ACCCAAAAAC AGAACTCTTA GCTGCATGGA AAATAACCAA 
AGACACCCAA ATTTTCCATC AAAGACACCC AAAAACGGAT CACGGAACCC AAAGGAACCC 
AAAGATCTAA ACCCCACACA TAACGCACGC GAGAGTGCTC CGACCAGTGA GCAGGAAGTT 
TTGTCGTTAC AGGCAGCCCC CCCTGTATTC CTGTATGGCC TGAGCGAACC CATCGGAAAA 
TTCCCGATGA GCGATAGCTG GTATCCGTCA CGGGATTTTC GACGACGGGC TGCGTTGTGG 
GGGATGGCTT TGCCGGAGAC AGAATTTACA CCTGCTGAAC TTGCCGCCTT CCGGGACTAC 
TGGGCAGCGG AGGGGAAAGT GTTTACGCAG ATTCAGTGGG AGCAGAAATT CGCCCGTCAC 
GTAAATCACG TCAGGGCGCA GGTTAAACCA GTCAGCAAAG GGGTAAACCA TGCAGCAGCA 
CCAGGTGGCA CCGCATCACG GGCAGTTCAG GAAATTCGGG CAGCACGTGA GCAGTGGGAA 
CGTGAAAACG GATTTATCAG CGACGGAAAC GGCCTGGAAG CTGTGGGAAC TCATGGGGGT 
GGTTTATTCG AACCGCTGGA TCCAGAAGAA CGGGGCCGCA CCTTCGAAGC TCTGGATTGC 
ACAGATTGGC GCGATGACTG A

Protein sequence

MSIDALRWAK KVKTGSSSSK SVLTWLADMC GADLCAYPSV SALAEVTELN KKTVQDSLRH 
LMEIGLIVDT GERKGRTKQI VVYRLIGVEE SVAEPEYTQK RESLKVGKIG AVNKNSTENG 
YVSAQNRPKN RTLSCMENNQ RHPNFPSKTP KNGSRNPKEP KDLNPTHNAR ESAPTSEQEV 
LSLQAAPPVF LYGLSEPIGK FPMSDSWYPS RDFRRRAALW GMALPETEFT PAELAAFRDY 
WAAEGKVFTQ IQWEQKFARH VNHVRAQVKP VSKGVNHAAA PGGTASRAVQ EIRAAREQWE 
RENGFISDGN GLEAVGTHGG GLFEPLDPEE RGRTFEALDC TDWRDD