Gene ECH74115_1152 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1152
Symbol
ID	6968794
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	1173124
End bp	1174326
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	53%
IMG OID	643385153
Product	hypothetical protein
Protein accession	YP_002269652
Protein GI	209395874
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.303869
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTGA TAAAGGCTTT TCAAAAAATA CATGTCGAAC CTCCTCTGGT TCTGTCGATT 
GGGAACCACA GATTATATCC GGAGGAAGGT TCGGCACCAG ATGAGGTAGC CATGCGTGAT 
TACGCAAAAG TTTCTCCGCG ATTCTGGCTG GGAGAAACGG GGAGAGAACT TAGAAAGGCG 
GGTGCAGAAG CGCAAGTTGT TGCTTTTTAC CTGATGACAT CCCCTCACGC AAATATGCTG 
GGTTTGTATT ACCTGCCAGT TTTATACCTT GCTCATGAAA CCGGGCTTGG TCTGGAAGGG 
GCTTCAAAGG GGCTTAAAAG GGCTGTTGAA GCTGGTTTTT GTAGCTATGA CCATGATGCA 
GAGATGGTCT GGGTCCATGA AATGGCAGCC TGGCAGGTTG GGGAAACGTT GAAGCCTGGC 
GATAACCGTT GTGCAGGTGT CAGGAATGAG TATGCATCAT TACCTGAAAA CGCTTTTCTG 
TCAGTGTTTT ACGACAGATA TAAAACGGAT TTCCATCTGG ATGTGAGGCG GAATAATAGC 
CGAAATTCGG TAAGGGGCTT CGAAGGGGCT TTTAAGGGGC TTCGAAGCCA AGAACAGGAA 
CAGGAGCAGG AGAAAGAACA GGAACAGGAC AAAAACACTA TGGTTCATGG CAAAAAAAAC 
ACCACGAACC AGGCAGGGGA TGTTCAGACC GTCAATCCTG GTCAGCCAGC AGGCACGACA 
CCGGAAGCCG ATTCGGGCGC TGTGCAGCAG GTGATGACCG CAGGGTCGGA GCAATCACAC 
CAACTGCAGC AGCCTGAAGC CGATTCCGCC ATTCAGCGGG AAGCCGATCG GGTAGTCCCG 
GAAAGCACCG GGCAGTCTGT GGGACGAGTG GATTATCCGG ATGTGTTCGA ACAGGTCTGG 
CGGGAATACC CGTTGCGTGC TGGGGCAAAC CCGAAGAAAT CCGCTTTCAG TGCCTGGAAG 
GCCAGATTGC GCGAGGGGGT GCCACCAGAG ACCATGCTGG ATGGTGTGAG GCGTTACGCG 
AGATACCTGG CGGCGACCGG GAAAGCGGGA ACGGAATTTG TTCAGCGAGC GACGACGTTT 
TTTGGGCCGG ACCGGAATTT TGAAAACCCC TGGTTGCTCC CGGTAAGCGG CACGAACAAC 
CAGCGTTGTG TGAATCATAT TTCTGAACCG GATACCGAAA TTCCGCCGGG ATTCAGGGGG 
TGA

Protein sequence

MSLIKAFQKI HVEPPLVLSI GNHRLYPEEG SAPDEVAMRD YAKVSPRFWL GETGRELRKA 
GAEAQVVAFY LMTSPHANML GLYYLPVLYL AHETGLGLEG ASKGLKRAVE AGFCSYDHDA 
EMVWVHEMAA WQVGETLKPG DNRCAGVRNE YASLPENAFL SVFYDRYKTD FHLDVRRNNS 
RNSVRGFEGA FKGLRSQEQE QEQEKEQEQD KNTMVHGKKN TTNQAGDVQT VNPGQPAGTT 
PEADSGAVQQ VMTAGSEQSH QLQQPEADSA IQREADRVVP ESTGQSVGRV DYPDVFEQVW 
REYPLRAGAN PKKSAFSAWK ARLREGVPPE TMLDGVRRYA RYLAATGKAG TEFVQRATTF 
FGPDRNFENP WLLPVSGTNN QRCVNHISEP DTEIPPGFRG