Gene ECH74115_5053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5053
Symbol
ID	6968057
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	4698078
End bp	4699298
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	39%
IMG OID	643388731
Product	type III secretion apparatus protein, YscD/HrpQ family
Protein accession	YP_002273157
Protein GI	209399186
COG category
COG ID
TIGRFAM ID	[TIGR02500] type III secretion apparatus protein, YscD/HrpQ family

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTATCCT CATATAAAAT AAAACTTCTC AATGGTGCGA TGCGTAATCG GGAATTACAA 
CTTCCGATGG GAAACCTAAC GCTAGGTACG GAAGATAACG ATATTGTTTA CTTTCCCCTT 
GAACAAGGCC TCAATCAGTT TTTACTTGAT ATACGTGAGG AAGGTGTTTT CCTTTTATCT 
CCGGTTGAAT TTTGGATTGA TGGGCAACCC ACGCCCTATG AAGCAGATAA ACCATTACCT 
GTCGGAAAGG TTATTGATAT AGCGGGATGT TGCTTCATCA TTGGTGATAT TGACCATTCC 
TTGCCATTGT CTGATGTGCC AGAAAGGTTC TCTGCCAAAA GTCGACGCAA AAAACGCCTT 
ATCCTGGCGA GCGTGATTGG TGCTACTTTT GCGTTGTCTG GTGCCATCGG CAGTTACGTT 
TTGCTTTCCC CAAAAGCTGA ACCCCCAACG TTTACCAGAG CTGATGTATA TCAGCAGCTA 
AAAGAAAACA AACTTCATGC AATCACTCTG GTATGGCATG GGAAAAATAT CGCGCTTTAT 
GGGCGTTGCG AATCAACCAC GGATTTAACT CCATTTTTTA ATTACCTAAA AGAAAAAAAT 
ATTTTTTATT ACAATAATAT CATTTGCAAT AACCAAATCA TATCCGCAAT TAATGATGTC 
TTAACGGAAT ACGGTTACAA AGATATCATT ATTACAAAAG GTAATAAGCC TGGATTCTTT 
CTGTTATCGG GATACATTCC CCCTTCACCC AAATGGAGCG AGGTTGAAAA TCTGTTACTG 
AATACGCCAG GAGTTGCAGG ATGGGAAATA CACAACAACA GTAACAATAA AATCAATGAA 
CTGGCATCAG AGTTTAAAAA GAATAAACTA ATAAACTATG TCAATATTTT CAAAAAGAAT 
GATGTCATCA TTGTTGCGGG GGAAGTTTCT CAACAGAATG AGAGTAAGAT CCTTGCCATT 
ATAAATGCAA TGAACAAAAA TAGTAACGCC AAGATACTCT TTCAGAACAT TCAGCCGTAC 
ATTTCAGCAG ATATTTTCCC CGGAAAAATA CTCAGAATCA GCGGTACGAT GAAGAATCCA 
ACAATTGCTC TTGATAATGG CACCAGCCTG GGGATTGGTA GCATTCTGAA AGGAGGCTAT 
GTCATAGACG CGATTGATCC TAAAGATGGT ATCAACATCT CCCGCCCAGA CGAATATATA 
CATATTCCAC TGTCGTATTA A

Protein sequence

MLSSYKIKLL NGAMRNRELQ LPMGNLTLGT EDNDIVYFPL EQGLNQFLLD IREEGVFLLS 
PVEFWIDGQP TPYEADKPLP VGKVIDIAGC CFIIGDIDHS LPLSDVPERF SAKSRRKKRL 
ILASVIGATF ALSGAIGSYV LLSPKAEPPT FTRADVYQQL KENKLHAITL VWHGKNIALY 
GRCESTTDLT PFFNYLKEKN IFYYNNIICN NQIISAINDV LTEYGYKDII ITKGNKPGFF 
LLSGYIPPSP KWSEVENLLL NTPGVAGWEI HNNSNNKINE LASEFKKNKL INYVNIFKKN 
DVIIVAGEVS QQNESKILAI INAMNKNSNA KILFQNIQPY ISADIFPGKI LRISGTMKNP 
TIALDNGTSL GIGSILKGGY VIDAIDPKDG INISRPDEYI HIPLSY