Gene ECD_00256 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_00256
Symbol	eaeH
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	284540
End bp	285772
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	49%
IMG OID
Product	attaching and effacing protein, pathogenesis factor
Protein accession	ACT42155
Protein GI	253976485
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCACATT ATAAAACAGG TCATAAACAA CCACGATTTC GTTATTCAGT TCTGGCCCGC 
TGCGTGGCGT GGGCAAATAT CTCTGTTCAG GTTCTTTTTC CACTCGCTGT CACCTTTACC 
CCAGTAATGG CGGCACGTGC GCAGCATGCG GTTCAGCCAC GGTTGAGCAT GGGAAATACT 
ACGGTAACTG CTGATAATAA CGTGGAGAAA AATGTCGCGT CGTTTGCCGC AAATGCCGGG 
ACATTTTTAA GCAGTCAGCC AGATAGCGAT GCGACACGTA ACTTTATTAC CGGAATGGCC 
ACAGCTAAAG CTAACCAGGA AATACAGGAG TGGCTCGGGA AATATGGTAC TGCGCGCGTC 
AAACTGAATG TCGATAAAGA TTTCTCGCTG AAGGATTCTT CGCTGGAAAT GCTTTATCCG 
ATTTATGATA CGCCAACAAA TATGTTGTTC ACTCAGGGAG CAATACATCG TACCGACGAT 
CGTACTCAGT CAAATATTGG TTTTGGCTGG CGTCATTTTT CAGGAAATGA CTGGATGGCG 
GGGGTGAATA CTTTTATCGA TCATGATTTA TCCCGTAGTC ATACCCGCAT TGGTGTTGGT 
GCGGAATACT GGCGTGATTA TTTGAAACTG AGCGCCAATG GTTATATCCG GGCTTCTGGC 
TGGAAAAAAT CGCCGGATGT TGAGGATTAT CAGGAACGCC CGGCGAATGG TTGGGATATC 
CGCGCAGAGG GCTATTTACC TGCCTGGCCG CAGCTTGGCG CAAGCCTGAT GTATGAACAG 
TATTATGGCG ATGAAGTCGG GCTGTTTGGT AAAGATAAGC GCCAGAAAGA CCCGCATGCT 
ATTTCTGCCG AGGTGACCTA TACGCCAGTG CCTCTTCTGA CACTGAGCGC CGGGCATAAG 
CAGGGCAAGA GTGGTGAGAA TGACACTCGC TTTGGCCTGG AAGTTAATTA TCGGATTACC 
CTGATGGCGG GAGTCAATCC CGTAGGAGGA AGTATGTGGG TCGACATTGA GGCTCCGGAA 
GGAGTGACGG AGAAGGATTA TCAATTCCTG CCGTCGAAGG CTGACCATTT CTCAGGTGGG 
AAAATCACGC GTACATTTAG TACCAGCAAG CCAGGTGTCT ATACGTTCAC ATTCAACGCA 
CTGACGTATG GCGGGTACGA AATGACGCCT GTGAAGGTGA CAATTAACGC CGTTGCTGCA 
GAGACTGAAA ATGGCGAGGA GGAGATGCCA TAA

Protein sequence

MSHYKTGHKQ PRFRYSVLAR CVAWANISVQ VLFPLAVTFT PVMAARAQHA VQPRLSMGNT 
TVTADNNVEK NVASFAANAG TFLSSQPDSD ATRNFITGMA TAKANQEIQE WLGKYGTARV 
KLNVDKDFSL KDSSLEMLYP IYDTPTNMLF TQGAIHRTDD RTQSNIGFGW RHFSGNDWMA 
GVNTFIDHDL SRSHTRIGVG AEYWRDYLKL SANGYIRASG WKKSPDVEDY QERPANGWDI 
RAEGYLPAWP QLGASLMYEQ YYGDEVGLFG KDKRQKDPHA ISAEVTYTPV PLLTLSAGHK 
QGKSGENDTR FGLEVNYRIT LMAGVNPVGG SMWVDIEAPE GVTEKDYQFL PSKADHFSGG 
KITRTFSTSK PGVYTFTFNA LTYGGYEMTP VKVTINAVAA ETENGEEEMP