Gene ECH74115_3794 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3794
Symbol
ID	6969354
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	3520301
End bp	3521857
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	51%
IMG OID	643387579
Product	putative transglycosylase
Protein accession	YP_002272032
Protein GI	209399097
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4623] Predicted soluble lytic transglycosylase fused to an ABC-type amino acid-binding protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	69
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAAAAAT TAAAGATTAA TTATCTGTTC ATCGGCATTC TGGCACTGCT GCTCGCGGTC 
GCTCTCTGGC CATCCATTCC CTGGTTTGGT AAAGCCGACA ACCGTATCGC CGCCATTCAA 
GCGCGGGGAG AGTTGCGTGT GAGCACCATT CATACTCCCC TGACGTATAA CGAAATCAAC 
GGGAAACCTT TTGGCCTGGA TTACGAACTG GCGAAACAGT TTGCCGATTA CCTCGGCGTA 
AAACTGAAAG TGACCGTGCG GCAGAATATC AGCCAGCTGT TTGACGACCT CGATAATGGT 
AACGCCGACC TGCTGGCGGC AGGACTTGTC TATAACAGTG AGCGGGTAAA AAATTATCAG 
CCTGGCCCTA CCTATTATTC CGTGTCACAA CAACTGGTTT ATAAAGTGGG TCAGTATCGC 
CCACGTACGC TGGGCAACCT GACGGCGGAG CAACTCACCG TTGCACCGGG TCATGTGGTG 
GTTAACGATC TCCAGACCCT GAAAGAAACA AAATTCCCGG AATTAAGCTG GAAGGTAGAC 
GACAAAAAAG GCTCTGCGGA ATTAATGGAA GATGTCATCG AAGGAAAACT CGATTACACC 
ATTGCTGATT CTGTCGCCAT CAGCCTGTTT CAGCGCGTTC ACCCGGAGCT CGCCGTAGCG 
CTCGATATCA CCGATGAACA ACCGGTGACC TGGTTTAGCC CGTTAGATGG CGATAATACC 
CTTTCCGCCG CCCTGCTCGA CTTCTTCAAC GAAATGAATG AAGACGGTAC GCTGGCACGC 
ATTGAAGAGA AATACCTGGG GCATGGCGAT GATTTTGATT ACGTCGATAC GCGCACATTT 
TTACGCGCCG TCGATGCGGT ACTGCCGCAG TTAAAGCCCC TGTTTGAGAA ATACGCCGAA 
GAAATTGACT GGCGTTTGCT GGCCGCTATT GCTTATCAGG AATCGCACTG GGATGCACAG 
GCCACTTCAC CGACGGGTGT GCGCGGCATG ATGATGTTAA CCAAAAATAC CGCGCAAAGC 
CTCGGCATTA CGGATCGTAC CGATGCCGAA CAGAGCATCA GCGGTGGCGT GCGTTATTTG 
CAGGATATGA TGAGTAAAGT GCCGGAAAGT GTGCCGGAGA ACGAGCGGAT CTGGTTTGCC 
CTCGCTGCGT ACAATATGGG CTATGCGCAT ATGCAGGATG CCCGCGCCCT GACGGCAAAA 
ACCAAAGGGA ATCCTGACAG TTGGGCTGAC GTAAAACAGC GTCTGCCTTT ACTTAGCCAG 
AAACCCTATT ACAGCAAGCT GACTTACGGC TACGCTCGTG GGCATGAAGC CTACGCTTAT 
GTCGAAAATA TTCGTAAGTA TCAGATTAGC CTGGTGGGTT ATCTGCAAGA GAAAGAGAAG 
CAGGCTACAG AAGCGGCGAT GCAACTGGCG CAGGATTATC CGGCGGTATC GCCTACGGAG 
TTGGGCAAAG AGAAATTTCC TTTTCTCTCG TTTCTTTCCC AGTCGTCATC AAACTATTTG 
ACCCATTCTC CCTCTCTGCT GTTTTCCAGG AAAGGGAGTG AAGAGAAACA AAATTAA

Protein sequence

MKKLKINYLF IGILALLLAV ALWPSIPWFG KADNRIAAIQ ARGELRVSTI HTPLTYNEIN 
GKPFGLDYEL AKQFADYLGV KLKVTVRQNI SQLFDDLDNG NADLLAAGLV YNSERVKNYQ 
PGPTYYSVSQ QLVYKVGQYR PRTLGNLTAE QLTVAPGHVV VNDLQTLKET KFPELSWKVD 
DKKGSAELME DVIEGKLDYT IADSVAISLF QRVHPELAVA LDITDEQPVT WFSPLDGDNT 
LSAALLDFFN EMNEDGTLAR IEEKYLGHGD DFDYVDTRTF LRAVDAVLPQ LKPLFEKYAE 
EIDWRLLAAI AYQESHWDAQ ATSPTGVRGM MMLTKNTAQS LGITDRTDAE QSISGGVRYL 
QDMMSKVPES VPENERIWFA LAAYNMGYAH MQDARALTAK TKGNPDSWAD VKQRLPLLSQ 
KPYYSKLTYG YARGHEAYAY VENIRKYQIS LVGYLQEKEK QATEAAMQLA QDYPAVSPTE 
LGKEKFPFLS FLSQSSSNYL THSPSLLFSR KGSEEKQN