Gene EcSMS35_1161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1161
Symbol
ID	6146216
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1180259
End bp	1181299
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	50%
IMG OID	641616039
Product	hypothetical protein
Protein accession	YP_001743226
Protein GI	170681092
COG category	[R] General function prediction only
COG ID	[COG5529] Pyocin large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00000610195
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	1.74313e-19
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGTATCG ATGCACTACG ATGGGCTAAA AAGGTGAAAA CCGGCAGTTC ATCCAGTAAG 
TCTGTATTGA CCTGGCTTGC TGATATGTGC GGTGCCGATT TGTGTGCATA CCCGTCTGTA 
TCTGCACTGG CAGAAGTAAC GGAACTAAAC AAAAAGACTG TGCAGGACAG CTTACGACAC 
CTGATGGAGA TTGGGTTAAT TGTTGATACC GGTGAGAGAA AAGGCAGAAC AAAGCAAATT 
GTGGTGTACC GACTTATCGG TGTAGAAGAA AGTGTTGCCG AGCCTGAATA CACCCAAAAA 
CGGGAGTCTT TAAAGGTGGG TAAAATTGGT GCTGTTAATA AAAACAGTAC CGAAAATGGT 
TATGTTTCAG CACAAAACAG ACCCAAAAAC GGAACTCTTA GCTGCATGGA AAATAACCAA 
AGACACCCAA ATTTTCCATC AAAGACACCC AAAAACGGAT CACGGAACCC AAAGGAACCC 
AAAGATCTAA ACCCCACACA TAACGCACGC GAGAGTGCTC CGACCAGTGA GCAGGAAGTT 
TTGTCGTTAC AGGCAGCACC CCTTGTATTC CTGGATGGCC TGAGCGAACC CATCGGAAAA 
TTTCCGATGA CCGATAGCTG GTATCCGTCA CGGGATTTTC GACGACGGGC TGCGTTGTGG 
GGGATGGCTT TGCCGGAGAC AGAATTTACA CCTGCTGAAC TTGCCGCCTT CCGGGACTAC 
TGGGCAGCGG AGGGGAAAGT GTTTACTCAG ATTCAGTGGG AGCAGAAATT CGCCCGTCAC 
GTAAATCACG TCAGGGCGCA GGTTAAACCA GTCAGCAAGG GGGTAAACCA TGCAGCAGCA 
CCAGGTGGCA CCGCATCACG GGCAGTTCAG GAAATTCGGG CAGCACGTGA GCAGTGGGAA 
CGTGAAAACG GATTTATCAG CGACGGAAAC GGTCTGGAAG CTGTGGGAAC TCATGGGGGA 
GGTTTATTCG AACCGCTGGA CCCAGAAGAA CGGGGCCGCA CCTTCGAAGC TCTGGATTGC 
ACAGATTGGC GCGATGACTG A

Protein sequence

MSIDALRWAK KVKTGSSSSK SVLTWLADMC GADLCAYPSV SALAEVTELN KKTVQDSLRH 
LMEIGLIVDT GERKGRTKQI VVYRLIGVEE SVAEPEYTQK RESLKVGKIG AVNKNSTENG 
YVSAQNRPKN GTLSCMENNQ RHPNFPSKTP KNGSRNPKEP KDLNPTHNAR ESAPTSEQEV 
LSLQAAPLVF LDGLSEPIGK FPMTDSWYPS RDFRRRAALW GMALPETEFT PAELAAFRDY 
WAAEGKVFTQ IQWEQKFARH VNHVRAQVKP VSKGVNHAAA PGGTASRAVQ EIRAAREQWE 
RENGFISDGN GLEAVGTHGG GLFEPLDPEE RGRTFEALDC TDWRDD