Gene ECH74115_3314 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3314
Symbol
ID	6969490
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	3047081
End bp	3048574
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	51%
IMG OID	643387126
Product	hypothetical protein
Protein accession	YP_002271590
Protein GI	209397294
COG category	[T] Signal transduction mechanisms
COG ID	[COG2200] FOG: EAL domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0795943
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.253919
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGCGA TACTGGTGAG CTGCCTTCAG TTTTTAGTGG CCTGGCATAA GCACGAAGTC 
AAATACGACA CACTGATTAC CGACGTACAA AAGTATCTCG ATACCTATTT TGCCGACCTG 
AAATCCACTA CTGACCGGCT CCAGCCGCTG ACCTTAGATA CATGCAAGCA AGCTAACCCC 
GAACTGACCG CCCGCGCGGC GTTTAGCATG AATGTCCGAA CGTTTGTGCT GGTGAAAGAT 
AAAAAAACAT TCTGTTCATC TGCGACCGGT GAGATGGACA TTCCACTCAA TGAATTGATT 
CCTGCGCTCG ACATTAATAA AAATGTCGAT ATGGCGATCT TACCCGGCAC GCCGATGGTG 
CCGAACAAAC CCGCAATCGT CATCTGGTAT CGCAACCCTT TGCTGAAAAA TAGCGGCGTC 
TTTGCCGCTC TGAATCTCAA CCTGACGCCT TCTCTCTTTT ATAGCTCACG GCAGGAAGAT 
TACGATGGCG TCGCCCTCAT TATTGGCAAT ACTGCGCTAT CTACCTTTTC TTCACGTTTG 
ATGAACGTTA ACGAATTAAC CGACATGCCA GTCCGTGAAA CTAAAATTGC GGGCATTCCT 
CTGACCGTTC GGCTTTATGC AGATGACTGG ACATGGAACG ATGTGTGGTA CGCATTTTTA 
CTGGGCGGCA TGAGTGGAAC TGTCGTTGGC CTGCTCTGCT ATTACCTGAT GAGCGTACGT 
ATGCGCCCCG GCAGAGAAAT CATGACCGCC ATCAAGCGCG AACAATTTTA CGTGGCGTAT 
CAACCGGTGG TGGATACACA AGCTTTGCGA GTAACGGGCC TGGAAGTACT GCTACGCTGG 
CGGCATCCTG TCGCGGGAGA AATTCCCCCG GATGCCTTCA TTAACTTTGC CGAATCGCAA 
AAGATGATTG TGCCGCTGAC TCAGCACCTG TTTGAGTTAA TTGCCCGCGA TGCCGCAGAA 
TTAGAAAAAG TGCTGCCGGT AGGCGTCAAA TTTGGCATTA ACATTGCGCC GGACCATCTG 
CACAGCGAAA GCTTTAAAGC AAATATCCAG AAACTGCTCA CTTCCCTACC CGCACACCAT 
TTCCAGATTG TGCTGGAAAT TACCGAGCGC GATATGCTGA AAGAGCAAGA AGCCACACAA 
CTCTTCGCCT GGCTGCACTC GGTCGGCGTA GAAATTGCTA TTGATGACTT CGGCACCGGG 
CACAGCGCGC TTATCTATCT TGAGCGTTTT ACGCTCGATT ATCTGAAAAT TGACCGTGGA 
TTTATCAACG CCATCGGTAC GGAAACGATC ACTTCACCCG TACTTGACGC GGTGCTGACG 
CTGGCGAAAC GCCTCAATAT GCTGACGGTT GCTGAGGGGG TCGAAACGCC GGAACAGGCG 
CGATGGCTAA GCGAACGCGG CGTTAATTTC ATGCAAGGCT ACTGGATTAG TCGCCCGTTA 
CCGCTGGACG ATTTTGTCCG CTGGCTGAAG AAACCGTATA CGCCGCAGTG GTAA

Protein sequence

MIAILVSCLQ FLVAWHKHEV KYDTLITDVQ KYLDTYFADL KSTTDRLQPL TLDTCKQANP 
ELTARAAFSM NVRTFVLVKD KKTFCSSATG EMDIPLNELI PALDINKNVD MAILPGTPMV 
PNKPAIVIWY RNPLLKNSGV FAALNLNLTP SLFYSSRQED YDGVALIIGN TALSTFSSRL 
MNVNELTDMP VRETKIAGIP LTVRLYADDW TWNDVWYAFL LGGMSGTVVG LLCYYLMSVR 
MRPGREIMTA IKREQFYVAY QPVVDTQALR VTGLEVLLRW RHPVAGEIPP DAFINFAESQ 
KMIVPLTQHL FELIARDAAE LEKVLPVGVK FGINIAPDHL HSESFKANIQ KLLTSLPAHH 
FQIVLEITER DMLKEQEATQ LFAWLHSVGV EIAIDDFGTG HSALIYLERF TLDYLKIDRG 
FINAIGTETI TSPVLDAVLT LAKRLNMLTV AEGVETPEQA RWLSERGVNF MQGYWISRPL 
PLDDFVRWLK KPYTPQW