Gene ECH74115_0688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0688
Symbol
ID	6971266
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	720093
End bp	721313
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	48%
IMG OID	643384724
Product	IbrA protein
Protein accession	YP_002269237
Protein GI	209400360
COG category	[R] General function prediction only
COG ID	[COG3969] Predicted phosphoadenosine phosphosulfate sulfotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.49112
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	76
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTATTT ATAAAATTCC TCTTCCGCTC AATATTCTGG AAGCTGCACG AGAGCGTATT 
ACCTGGACAC TCAACACCCT ACCCCGCGTT TGTGTCTCAT TTTCTGGCGG CAAAGACTCT 
GGTTTAATGC TGCATCTGAC AGCCGAACTC GCCCGACAAA TGGGCAAAAA AATCTGCGTT 
TTGTTTATCG ACTGGGAGGC GCAATTCTCT TGCACCATTA ACTATGTTCA GTCCCTGCGC 
GAGTTGTACA CCGATGTCAT CGAAGAGTTT TACTGGGTTG CGCTCCCGCT TACGACGCAA 
AATTCCCTTT CACAATACCA ACCCGAATGG CAGTGCTGGG AACCTGATGT CGAATGGGTA 
CGTCAGCCCC CGCAAGATGC GATAACCGAT CCTGACTTTT TCTGCTTTTA CCAGCCAGGC 
ATGACCTTCG AACAATTTGT ACGTGAGTTT GCCGAATGGT TTTCACAAAA ACGTCCGGCG 
GCGATGATGA TCGGCATCCG TGCGGATGAG TCCTACAACC GTTTTGTCGC CATCGCCAGT 
TTAAATAAAC AACGTTTTGC CGACGATAAA CCCTGGACTA CGGCCGCACC AGGCGGTCAT 
AGCTGGTACA TTTACCCCAT TTACGACTGG AAAGTGGCTG ATATCTGGAC CTGGTATGCA 
AATCATCAAA GTCTCTGCAA CCCACTGTAT AACCTAATGT ATCAGGCAGG CGTTCCTCTG 
CGTCATATGC GAATTTGCGA ACCTTTTGGC CCGGAGCAAC GACAAGGATT ATGGCTCTAT 
CACGTTATCG AACCGGATCG CTGGGCTGCT ATGTGCGCAC GAGTCAGCGG GGTAAAAAGT 
GGCGGCATTT ACGCCGGACA TGATAATCAT TTCTATGGGC ATCGGAAAAT CCTCAAGCCA 
GAACATTTAG ACTGGCAAGA ATATGCATTA TTGCTGCTCA ATAGCATGCC GGAAAAAACA 
GCTGAGCATT ACCGCAATAA AATCGCCATT TATTTGCACT GGTATCAGAA AAAAGGCATC 
GAGGTTCCAC AAACCCAGCA AGGGGACATT GGCGCGAAAG ATATCCCCTC CTGGCGGCGG 
ATATGCAAAG TTTTACTCAA TAACGATTAC TGGTGTCGGG CATTATCATT TAGTCCTACG 
AAAGCGAAGA ACTATCAGCG TTATAACGAA CGGATAAAAG GAAAACGTCA GGAATGGGGG 
ATACTATGCA ACAACGATTA A

Protein sequence

MSIYKIPLPL NILEAARERI TWTLNTLPRV CVSFSGGKDS GLMLHLTAEL ARQMGKKICV 
LFIDWEAQFS CTINYVQSLR ELYTDVIEEF YWVALPLTTQ NSLSQYQPEW QCWEPDVEWV 
RQPPQDAITD PDFFCFYQPG MTFEQFVREF AEWFSQKRPA AMMIGIRADE SYNRFVAIAS 
LNKQRFADDK PWTTAAPGGH SWYIYPIYDW KVADIWTWYA NHQSLCNPLY NLMYQAGVPL 
RHMRICEPFG PEQRQGLWLY HVIEPDRWAA MCARVSGVKS GGIYAGHDNH FYGHRKILKP 
EHLDWQEYAL LLLNSMPEKT AEHYRNKIAI YLHWYQKKGI EVPQTQQGDI GAKDIPSWRR 
ICKVLLNNDY WCRALSFSPT KAKNYQRYNE RIKGKRQEWG ILCNND