Gene ECH74115_1565 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1565
Symbol
ID	6966561
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	1529076
End bp	1530437
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	40%
IMG OID	643385530
Product	hypothetical protein
Protein accession	YP_002270024
Protein GI	209400220
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.00000172498
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCTTCCTA CATCGCAATT ACGACCGACC GGGACATTCT GCTCCTATTC CGCTGAAACA 
TCAGCAGACA TCAAAAGCGA AATCACACCA ATTCAGATAG AAGAAGCGCG GGCCAGTGGT 
CGTTTATATA TCAAAGATTG TGATATTGAG TATCTGCCAC AGTTACCAAA CGAAATAACA 
TCAGTTACAA TCGAAAACTG CAACAACCTG ACAACCCTTA CAGGATTGCC GGTTAATACA 
CAAAACCTCT CCGTCATTAA CTGTGAAAAA TTACAAATCA CAGACATGCC ATCAACCGTA 
AAAAATCTAC ATATTGAATT AACTGATTCA CCATTTATAC ATTTCATATC TGAAGGCATC 
GAGTGCCTGA CGGTTTGCCA CTGCTATATA TCTGGAGTGC CAGAGAGTGT CCGCTACCTT 
GAAATAAAAG GTAGCGCCAC AGACAGCATA AAAAATGTTC CAAACGGGTT ATCATCTCTC 
AGCATCAATA GCTATAACCC GGAGAATCAG GCCAGAATTG ACAACCTGAT ATCACCGTCA 
CTGAAGACGC TATCGCTGAC TGGATGTAGC AATATTATAC TGCCGGAGAA ACTTCCGGAG 
AGTGTGACAT CGGTAACCAT TCATGCGGAG CAGAAAACCA CGTGGAACAT CGGTGTTGAA 
GGGATGCCTG ATGGGCTGGA TCTTGATTTA CAAAATGTAC TACTCTCTCC AGATGTAGTT 
AAAGCAAAAA ACATCACCTT TCAGGGCAAC GCTCTGGATG TGGCCTTACA CTTTCGCGAG 
GGAGACATTG TCTATGGACT ATCTTCACCC AGAGAAAAAC TTGTCAACAG CATTAAACTA 
GTTAACGACT TTTCCAAAAA AGATATTATA ACTCAGAATA CGTTAACAAA CGCAGTATGG 
GACCCCAGAA CACCTCGCAA ATATAAGCAA GATCCACTTA TCAAAAGAGC ATTAAATGAA 
CACGAAAGAG GAATAAAATT TAAACAACAC TTAAAGAATC ACAATAATTA TAATGTTACC 
ATGGCCGACC TTTCCGTATA CAATCGCGAC AAATTATGGG CAAAAACAAG CAAGGCCGGC 
CTAGAGTTTC AGACATTAAC ACGCAATAAA ACGGTTATTT TTTGTGCGGA TGAGCTTGTC 
AACTCACTCA AACTCATAGC TAACAAGTCA GAGGGCTATG GCCAGAGTAT TACCGCCAGC 
GAATTACGAT GGATTTACCG TAATAAAGAC AACAACCAAA TAATGAAAAA CATAAAATTT 
TATCTACATG GCAAAGAGAT ACCAGCAGAA AGAATATTAG ATACACCAGA ATGGAAAGAC 
TATCGTCCAA AATACTCTGG TTCCACATAT AAATATTCTT AA

Protein sequence

MLPTSQLRPT GTFCSYSAET SADIKSEITP IQIEEARASG RLYIKDCDIE YLPQLPNEIT 
SVTIENCNNL TTLTGLPVNT QNLSVINCEK LQITDMPSTV KNLHIELTDS PFIHFISEGI 
ECLTVCHCYI SGVPESVRYL EIKGSATDSI KNVPNGLSSL SINSYNPENQ ARIDNLISPS 
LKTLSLTGCS NIILPEKLPE SVTSVTIHAE QKTTWNIGVE GMPDGLDLDL QNVLLSPDVV 
KAKNITFQGN ALDVALHFRE GDIVYGLSSP REKLVNSIKL VNDFSKKDII TQNTLTNAVW 
DPRTPRKYKQ DPLIKRALNE HERGIKFKQH LKNHNNYNVT MADLSVYNRD KLWAKTSKAG 
LEFQTLTRNK TVIFCADELV NSLKLIANKS EGYGQSITAS ELRWIYRNKD NNQIMKNIKF 
YLHGKEIPAE RILDTPEWKD YRPKYSGSTY KYS