Gene ECH74115_0736 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0736
Symbol
ID	6970630
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	762050
End bp	763477
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	47%
IMG OID	643384768
Product	DnaJ domain protein
Protein accession	YP_002269281
Protein GI	209396284
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	0.726449
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAATT GCTGGAAGAT CCTCAACATA GAGGAAACGA CTGATGTCGA TATTATCCGC 
CGCGCTTATC TGGCGCTGTT ACCGTCCTTT CATCCAGAAA CCGATCCGCA GGGTTTTAAA 
CAACTTCGTC AGGCGTATGA GGAAGCGCTC CGGATTGCGC AGTCGCCTGC TAAATCTGTT 
TGGCAACCAG AAGAATATGA GGTAGCAGAA CATGAAATTC TGCTCGCCTT TCGTGCGTTA 
CTTGCCTCTG ATAGTGAACG TTTTCTGCCC TCCGCCTGGC AGCGATTCAT TCAGCAATTA 
AATTATTGCT CGATGAATGA GATTGATGAA TTACGCTGGT CGCTGTGCAC AATAGCCATG 
AACACTGCCC ATTTATCCTT CGAGTGCGTG GTGTTATTAG CAGAAAGATT GCGGTGGTTG 
CAGGAGGAAA ACGTCGGGGA AATAGACGAA GAAGAACTGG AATCCTTTTT ATATGCCATT 
GCGAAGGGAA ATGTTTTTAA CTTCCAGATC ATTCTGCATC TGCCCGTTGC CGTGCAAAAT 
GACACCATCG ATTTTTACCA AATGTTCGCC CGGATTTGGT CATCGCATCC AGAATGGCTG 
ACATTGTATT TAGCGCAACA TCGCGCAGTG ATTATCCCCG ATGATGCAAA ACTGCACAGA 
AATTTACTCC GCTGGTATAG TGCAGGTCGC CTGGGAATCC CCGAACTCCT GGATTACGCC 
CGGTCGTGGC GGGAAGCTGA ACCTGATAAT GAAGATGCGC GTTATTATGA ATACGCGCAA 
CGCGTCTATT GTGGAGAAGG CGAAAGCCTG CTGGCAGAAC TTTGTGACTA CTGGCACGAG 
TATCCCTCCA CTCAGGCGGA TGCTTTAATG TTGCAATGGT GCCGTCAGCA TCGAGTCGAT 
TATTACCCAT TAGTGGTGAT GATGATTGAA GCTCGTGAAC TGGTTAACGA CCAGGGAAAA 
CCGCTACTTT ATGTCCCCGG CGACAGCGCC CGTACGCGTT TTCATTTATA CGAAATACTC 
AGCGATGAAA AACTCTCTGC TCTGGGGCGT TCACTGGTCG AGATGGTTTT GCACAAAGGA 
TGTAAGCCGC GGATCTCACT CACGCGTGAT ACAGAACATA CCTTATGGCC ATTATATCTA 
GTTGCCAAAC AATTAGTGCA GGCCAGCCAA CCTACAGAAG AATCATTAAT GCCGATCGTA 
AGCCGTCTTG ATGCAGAAAA TCGTTGTCCA CTGGAAGCAT TAATTATTCG TCGATTATTA 
ATTCAGGCGG CGAATTTTAC CGAGAAGCAA ACTGTTGAAC CGGAGCCGCA ACCGCAGCCA 
ATGCCCGTTG ACGATGGTGG GCCAGGCTGT CTGGGCATCA TTAAAATTAT TTTCTATATT 
TTTATCTTTG CTGGTTTGAT AGGGAAAATA CTCCATCTGT TCGGGTGA

Protein sequence

MKNCWKILNI EETTDVDIIR RAYLALLPSF HPETDPQGFK QLRQAYEEAL RIAQSPAKSV 
WQPEEYEVAE HEILLAFRAL LASDSERFLP SAWQRFIQQL NYCSMNEIDE LRWSLCTIAM 
NTAHLSFECV VLLAERLRWL QEENVGEIDE EELESFLYAI AKGNVFNFQI ILHLPVAVQN 
DTIDFYQMFA RIWSSHPEWL TLYLAQHRAV IIPDDAKLHR NLLRWYSAGR LGIPELLDYA 
RSWREAEPDN EDARYYEYAQ RVYCGEGESL LAELCDYWHE YPSTQADALM LQWCRQHRVD 
YYPLVVMMIE ARELVNDQGK PLLYVPGDSA RTRFHLYEIL SDEKLSALGR SLVEMVLHKG 
CKPRISLTRD TEHTLWPLYL VAKQLVQASQ PTEESLMPIV SRLDAENRCP LEALIIRRLL 
IQAANFTEKQ TVEPEPQPQP MPVDDGGPGC LGIIKIIFYI FIFAGLIGKI LHLFG