Gene ECH74115_1914 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1914
Symbol
ID	6968028
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	1808279
End bp	1809448
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	52%
IMG OID	643385847
Product	tetratricopeptide repeat protein
Protein accession	YP_002270336
Protein GI	209396639
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2956] Predicted N-acetylglucosaminyl transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000156513
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	3.47203e-22
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCTGGAGT TGTTGTTTCT GCTTTTGCCT GTAGCCGCTG CCTATGGCTG GTATATGGGC 
CGCAGAAGTG CGCAACAAAA CAAGCAAGAT GAAGCCAACC GCTTGTCGCG TGATTACGTA 
GCGGGGGTTA ACTTCCTGCT TAGTAATCAA CAGGATAAAG CGGTAGACCT GTTTCTCGAT 
ATGCTTAAAG AGGATACAGG CACCGTTGAA GCCCACCTTA CGCTCGGAAA CCTGTTCCGT 
TCGCGTGGCG AAGTTGATCG CGCTATTCGC ATCCATCAGA CCCTAATGGA AAGCGCCTCG 
CTGACCTATG AACAGCGTCT GTTGGCGATT CAACAACTGG GGCGTGATTA CATGGCCGCC 
GGGTTATATG ACCGCGCGGA AGACATGTTC AATCAGCTGA CCGATGAAAC TGACTTCCGC 
ATTGGCGCGC TGCAACAGTT GCTACAAATC TACCAGGCTA CCAGTGAGTG GCAGAAAGCA 
ATTGATGTTG CCGAACGCCT GGTGAAGCTG GGTAAAGATA AACAGCGCGT CGAAATTGCC 
CATTTCTACT GTGAGTTAGC CCTGCAGCAT ATGGCCAGCG ACGATCTCGA TCGTGCCATG 
ACCTTGCTAA AAAAAGGGGC GGCGGCAGAT AAAAACAGCG CCCGCGTATC CATCATGATG 
GGACGCGTGT TTATGGCGAA AGGAGAATAC GCCAAAGCCG TCGAAAGTTT GCAACGCGTG 
ATATCCCAGG ACAGAGAACT GGTCAGCGAA ACGCTGGAAA TGCTGCAAAC CTGCTATCAG 
CAGTTGGGTA AAACTGCCGA ATGGGCAGAA TTCCTGCAGC GCGCGGTGGA AGAGAACACC 
GGTGCCGATG CTGAATTGAT GCTTGCTGAT ATCATCGAAG CGCGCGACGG TAGTGAGGCC 
GCACAGGTCT ATATTACGCG CCAGCTTCAG CGTCATCCGA CCATGCGTGT GTTCCATAAG 
TTAATGGATT ACCACTTAAA TGAAGCGGAA GAAGGGCGTG CCAAAGAGAG CCTGATGGTG 
CTGCGTGACA TGGTTGGCGA GAAGGTACGT AGTAAGCCTC GTTATCGCTG CCAGAAATGT 
GGTTTTACCG CATACACCCT CTACTGGCAT TGTCCGTCTT GTCGTGCCTG GTCAACTATT 
AAACCGATTC GCGGTCTTGA TGGCCTGTAA

Protein sequence

MLELLFLLLP VAAAYGWYMG RRSAQQNKQD EANRLSRDYV AGVNFLLSNQ QDKAVDLFLD 
MLKEDTGTVE AHLTLGNLFR SRGEVDRAIR IHQTLMESAS LTYEQRLLAI QQLGRDYMAA 
GLYDRAEDMF NQLTDETDFR IGALQQLLQI YQATSEWQKA IDVAERLVKL GKDKQRVEIA 
HFYCELALQH MASDDLDRAM TLLKKGAAAD KNSARVSIMM GRVFMAKGEY AKAVESLQRV 
ISQDRELVSE TLEMLQTCYQ QLGKTAEWAE FLQRAVEENT GADAELMLAD IIEARDGSEA 
AQVYITRQLQ RHPTMRVFHK LMDYHLNEAE EGRAKESLMV LRDMVGEKVR SKPRYRCQKC 
GFTAYTLYWH CPSCRAWSTI KPIRGLDGL