Gene ECH74115_2750 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_2750
Symbol
ID	6969147
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	2571627
End bp	2572631
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	53%
IMG OID	643386605
Product	putative sulfite oxidase subunit YedY
Protein accession	YP_002271084
Protein GI	209397989
COG category	[R] General function prediction only
COG ID	[COG2041] Sulfite oxidase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000000229765
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.192354
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGA ATCAATTTTT AAAAGAATCA GATGTTACGG CCGAGTCGGT ATTCTTTATG 
AAGCGTCGGC AGGTGTTAAA AGCACTGGGC ATCAGCGCAG CTGCACTTTC TTTGCCTCAC 
GCTGCGCATG CCGATCTGCT TAGCTGGTTT AAAGGGAACG ATCGCCCACC CGCCCCCGCC 
GGAAAAGCGC TGGAGTTCAG CAAGCCTGCC GCCTGGCAAA ATAACCTGCC ACTGACGCCA 
GCAGATAAAG TCTCCGGTTA TAACAACTTC TATGAATTCG GGCTGGATAA AGCCGATCCC 
GCCGCTAATG CTGGTAGCCT GAAAACCGAT CCATGGACAC TGAAAATCAG CGGCGAAGTG 
GCAAAACCAT TGACCCTCGA TCACGATGAT TTAACCCGTC GCTTCCCGCT GGAAGAGCGT 
ATTTATCGTA TGCGCTGCGT GGAAGCGTGG TCGATGGTGG TGCCGTGGAT TGGTTTTCCG 
CTGCACAAAT TGCTGGCGCT TGCCGAACCC ACCAGCAATG CGAAGTATGT CGCTTTCGAA 
ACAATTTATG CACCGGAACA GATGCCAGGC CAGCAGGACC GCTTTATCGG CGGCGGGCTG 
AAATATCCTT ATGTCGAAGG ATTGCGTCTC GACGAAGCAA TGCATCCGCT CACACTGATG 
ACCGTAGGTG TTTATGGCAA GGCGTTACCG CCACAAAATG GCGCGCCGGT GCGACTGATT 
GTGCCGTGGA AATATGGCTT TAAAGGGATT AAATCGATCG TCAGTATTAA GCTGACCCGC 
GAGCGTCCGC CAACCACCTG GAATCTGGCA GCGCCTGACG AATACGGTTT TTACGCCAAC 
GTTAATCCGC ATGTTGATCA CCCACGCTGG TCACAGGCTA CCGAACGATT TATTGGTTCA 
GGCGGCATCC TCGATGTACA GCGCCAGCCA ACGCTACTGT TTAATGGTTA CGCCGACCAG 
GTGGCATCGC TGTATCGTGG CCTGGATTTG CGGGAGAATT TCTGA

Protein sequence

MKKNQFLKES DVTAESVFFM KRRQVLKALG ISAAALSLPH AAHADLLSWF KGNDRPPAPA 
GKALEFSKPA AWQNNLPLTP ADKVSGYNNF YEFGLDKADP AANAGSLKTD PWTLKISGEV 
AKPLTLDHDD LTRRFPLEER IYRMRCVEAW SMVVPWIGFP LHKLLALAEP TSNAKYVAFE 
TIYAPEQMPG QQDRFIGGGL KYPYVEGLRL DEAMHPLTLM TVGVYGKALP PQNGAPVRLI 
VPWKYGFKGI KSIVSIKLTR ERPPTTWNLA APDEYGFYAN VNPHVDHPRW SQATERFIGS 
GGILDVQRQP TLLFNGYADQ VASLYRGLDL RENF