Gene ECH74115_4838 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4838
Symbol
ID	6967009
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	4473770
End bp	4474972
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	55%
IMG OID	643388529
Product	pyridine nucleotide-disulfide oxidoreductase family protein
Protein accession	YP_002272957
Protein GI	209396835
COG category	[R] General function prediction only
COG ID	[COG2081] Predicted flavoproteins
TIGRFAM ID	[TIGR00275] flavoprotein, HI0933 family

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAAAGGT TTGATGCCAT TATTATAGGC GCTGGTGCGG CGGGTATGTT CTGTTCTGCG 
CTGGCAGGTC AGGCAGGACG CCGGGTTCTG CTGATCGATA ATGGTAAAAA ACCAGGGCGC 
AAAATCCTTA TGTCTGGCGG TGGGCGCTGC AACTTTACCA ACCTTTATGT CGAACCGGGC 
GCTTATCTGA GCCAGAATCC GCATTTTTGT AAGTCTGCAC TCGCGCGTTT TACCCAGTGG 
GATTTCATTG ATCTGGTCAA TAAACACGGC ATCGCCTGGC ACGAGAAAAC GTTAGGGCAA 
CTCTTCTGCG ATGACTCCGC GCAGCAGATT GTCGACATGC TGGTGGATGA GTGCGAGAAG 
GGCAATGTGA CCGTCAGATT GCGTAGCGAA GTGCTGAGTG TGGCGAAGGA TGATACAGGC 
TTCACGCTTG AACTGAACGG CATGACTGTC GGTTGTGAAA AGCTGGTCAT CGCGACCGGC 
GGGCTGTCAA TGCCGGGCCT GGGCGCGTCG CCGTTTGGTT ATAAGATTGC CGAACAATTT 
GGCCTCAACG TGCTGCCGAC CCGCGCGGGT CTGGTGCCAT TCACTCTGCA TAAACCGTTG 
CTCGAAGAGT TACAGGTGCT GGCGGGCGTG GCGGTGCCTT CCGTGATTAC CGCTGAAAAC 
GGCACCGTTT TCCGTGAGAA CTTACTCTTC ACCCATCGCG GCTTGTCTGG ACCGGCGGTG 
TTGCAAATTT CCAGCTACTG GCAACCGGGG GAATTTGTCA GTATCAATCT GCTACCGGAT 
GTGGACCTCG AAACCTTCCT GAATGAGCAG CGTAACGCAC ATCCGAATCA GAGCCTGAAA 
AACACACTGG CGGTTCATCT ACCGAAGCGG TTGGTTGAAC GCTTACAGCA ACTCGGGCAA 
ATCCCGGATG TTTCGCTAAA ACAGCTCAAC GTGCGTGACC AACAGGCACT GATTAGCACA 
TTGACCGACT GGCGCGTACA ACCCAACGGC ACTGAAGGCT ATCGCACTGC CGAAGTGACG 
CTCGGCGGCG TGGACACCAA CGAACTCTCT TCACGGACGA TGGAAGCGCG CAAAGTGCCT 
GGGCTGTACT TTATCGGCGA AGTGATGGAC GTTACCGGCT GGCTGGGGGG CTATAACTTC 
CAGTGGGCGT GGTCGAGTGC GTGGGCTTGT GCGCAGGATT TGATTGCAGC GAAGTCGTGC 
TGA

Protein sequence

MERFDAIIIG AGAAGMFCSA LAGQAGRRVL LIDNGKKPGR KILMSGGGRC NFTNLYVEPG 
AYLSQNPHFC KSALARFTQW DFIDLVNKHG IAWHEKTLGQ LFCDDSAQQI VDMLVDECEK 
GNVTVRLRSE VLSVAKDDTG FTLELNGMTV GCEKLVIATG GLSMPGLGAS PFGYKIAEQF 
GLNVLPTRAG LVPFTLHKPL LEELQVLAGV AVPSVITAEN GTVFRENLLF THRGLSGPAV 
LQISSYWQPG EFVSINLLPD VDLETFLNEQ RNAHPNQSLK NTLAVHLPKR LVERLQQLGQ 
IPDVSLKQLN VRDQQALIST LTDWRVQPNG TEGYRTAEVT LGGVDTNELS SRTMEARKVP 
GLYFIGEVMD VTGWLGGYNF QWAWSSAWAC AQDLIAAKSC