Gene EcHS_A3691 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3691
Symbol
ID	5592725
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3678717
End bp	3679919
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	55%
IMG OID	640922805
Product	pyridine nucleotide-disulfide oxidoreductase family protein
Protein accession	YP_001460285
Protein GI	157162967
COG category	[R] General function prediction only
COG ID	[COG2081] Predicted flavoproteins
TIGRFAM ID	[TIGR00275] flavoprotein, HI0933 family

Plasmid Coverage information

Num covering plasmid clones	59
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAAAGGT TTGATGCCAT TATTATAGGC GCTGGTGCGG CGGGTATGTT CTGTTCTGCG 
CTGGCAGGTC AGGCAGGACG CCGGGTTCTG CTGATCGATA ATGGTAAAAA ACCAGGGCGC 
AAAATCCTTA TGTCTGGCGG TGGGCGCTGC AACTTTACCA ACCTTTATGT CGAACCAGGC 
GCTTATCTGA GCCAGAATCC GCATTTTTGT AAGTCTGCAC TCGCGCGTTT TACCCAGTGG 
GATTTCATTG ATCTGGTCAA TAAACACGGC ATCGCCTGGC ACGAGAAAAC GTTAGGACAA 
CTCTTCTGCG ATGACTCCGC GCAGCAGATT GTCGACATGC TGGTGGATGA GTGCGAGAAG 
GGCAATGTAA CCTTCAGATT GCGTAGCGAA GTGCTGAGTG TGGCGAAGGA TGAAACAGGC 
TTCACGCTTG AACTGAACGG CATGACTGTC GGTTGCGAAA AGCTGGTCAT CGCGACCGGT 
GGGCTGTCAA TGCCGGGGCT GGGCGCGTCG CCGTTTGGTT ATAAGATTGC CGAACAATTT 
GGCCTCAACG TGCTGCCGAC CCGTGCGGGT CTGGTGCCAT TCACTCTGCA TAAACCGTTG 
CTCGAAGAGT TACAGGTGCT GGCGGGCGTG GCGGTGCCTT CCGTGATTAC CGCTGAAAAC 
GGCATCGTTT TCCGTGAGAA CTTACTCTTC ACCCATCGCG GCTTGTCTGG ACCGGCGGTG 
TTGCAGATTT CAAGCTACTG GCAACCGGGT GAATTTGTCA GTATCAATCT GCTACCTGAT 
GTGGACCTCG AAACCTTCCT GAATGAGCAG CGTAACGCAC ATCCGAATCA GAGCCTGAAA 
AACACACTGG CGGTTCATCT ACCGAAGCGG TTGGTTGAAC GCTTACAGCA ACTCGGGCAA 
ATCCCGGATG TTTCGCTAAA ACAGCTCAAC GTGCGTGACC AACAGGCACT GATTAGCACA 
TTGACCGACT GGCGCGTACA ACCCAACGGC ACTGAAGGCT ATCGCACTGC CGAAGTGACG 
CTCGGCGGCG TGGACACCAA CGAACTCTCT TCACGGACGA TGGAAGCGCG CAAAGTGCCT 
GGGCTGTACT TCATCGGCGA AGTGATGGAC GTCACCGGCT GGCTGGGGGG CTATAACTTC 
CAGTGGGCGT GGTCGAGTGC ATGGGCTTGT GCGCAGGATT TGATTGCAGC GAAGTCGTCC 
TGA

Protein sequence

MERFDAIIIG AGAAGMFCSA LAGQAGRRVL LIDNGKKPGR KILMSGGGRC NFTNLYVEPG 
AYLSQNPHFC KSALARFTQW DFIDLVNKHG IAWHEKTLGQ LFCDDSAQQI VDMLVDECEK 
GNVTFRLRSE VLSVAKDETG FTLELNGMTV GCEKLVIATG GLSMPGLGAS PFGYKIAEQF 
GLNVLPTRAG LVPFTLHKPL LEELQVLAGV AVPSVITAEN GIVFRENLLF THRGLSGPAV 
LQISSYWQPG EFVSINLLPD VDLETFLNEQ RNAHPNQSLK NTLAVHLPKR LVERLQQLGQ 
IPDVSLKQLN VRDQQALIST LTDWRVQPNG TEGYRTAEVT LGGVDTNELS SRTMEARKVP 
GLYFIGEVMD VTGWLGGYNF QWAWSSAWAC AQDLIAAKSS