Gene ECH74115_5050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5050
Symbol
ID	6966626
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	4695106
End bp	4696230
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	47%
IMG OID	643388728
Product	EspD
Protein accession	YP_002273154
Protein GI	209398054
COG category	[S] Function unknown
COG ID	[COG5613] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTAACG TAAATAACGA TACCCTGTCT GTAACGTCTG GGGTTAATAC CGCCTCGGGT 
ACTTCTGGTA TTACTCAATC TGAAACGGGT TTATCGCTGG ATTTACAACT GGTTAAATCC 
ATGAACTCGT CAGCAGGCTG GACAGAAAGT AGCCCTTTAC CGACGCCGCC GGCAGGTCAC 
TCATTAGTGA CGCCCTCTGC TGCTGAGGAT GTCCTTAGTA AATTGTTTGG TGGTATTAGT 
GGTGAGGTTA CAAGTCGCAC TGAGGAGGCA GAGCCACAGC GCACAAGCTA TCCCTATCTC 
TCTCAGGTGA ATACCGTTGA CCCTCAGCAA ATGATGATGA TGGTCACTCT GTTATCCCTG 
GATACTTCCG CGCAGAAAGT CTCGAGTCTG AAAAACTCTA ACGAGATTTA TATGGATGGG 
CAAACTAAAG CGCTGGAGAA TAAAACGCAG GAGTATAAAA AACAGCTCGA AGAACAACAG 
AAAGCCGAAG AGAAATCACA AAAAAGTAAA ATTGTTGGCC AGGTCTTTGG TTGGTTGGGC 
GTCGCATTAA CAGCCGTTGC CGCTGTTTTT AACCCAGCAC TCTGGGCTGT TGTTGCCATT 
GGTGCAACAG CAATGGCACT GCAAACGGCA GTCGATGTAA TGGGGGAAAA TGCCCCTCAG 
GGATTAAAGA CTGCAGCACA GGTCTTTGGC GGAATATCTA TGGCCGCAAG CATTCTGACA 
GCCGGCGTTG GCGGGGTGTC TTCACTGTTA TCTAAATTTG GTAATGTTGC TAACAAAATT 
GGCTCAAGCG TTGTAAAAGT CGTTGAGAAG GCGGCAGAAG CGCTGGTTAA AAACGTTTTT 
GCAAAAATTT CGACAGTGGC TGAGGGCGTT ACGAACGGTA TTCGTTCTGC CGGGACAACT 
GCGTTGAATA ATGAGGCTGC GCAACTCCAA ATGTTGTCTC AGTTAGCTGC TTTCGCGGTG 
CAAAACTTAA CTCGACAGAG TGAAAGCTTA GGTGAGAGTG CGAAGCTCGA GCTGGATAAA 
GCGGCAAGCG AGTTACAAAA TCAGGCGAGC TATTTACAAA GTGTTTCTCA ACTGATGTCC 
GATTCAGCAC GGGTAAATAG TCGTATTGTT AGTGGCCGAA TTTAA

Protein sequence

MLNVNNDTLS VTSGVNTASG TSGITQSETG LSLDLQLVKS MNSSAGWTES SPLPTPPAGH 
SLVTPSAAED VLSKLFGGIS GEVTSRTEEA EPQRTSYPYL SQVNTVDPQQ MMMMVTLLSL 
DTSAQKVSSL KNSNEIYMDG QTKALENKTQ EYKKQLEEQQ KAEEKSQKSK IVGQVFGWLG 
VALTAVAAVF NPALWAVVAI GATAMALQTA VDVMGENAPQ GLKTAAQVFG GISMAASILT 
AGVGGVSSLL SKFGNVANKI GSSVVKVVEK AAEALVKNVF AKISTVAEGV TNGIRSAGTT 
ALNNEAAQLQ MLSQLAAFAV QNLTRQSESL GESAKLELDK AASELQNQAS YLQSVSQLMS 
DSARVNSRIV SGRI