Gene EcSMS35_1807 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1807
Symbol
ID	6146707
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1827962
End bp	1829005
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	55%
IMG OID	641616683
Product	gfo/idh/mocA family protein
Protein accession	YP_001743861
Protein GI	170684205
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAGCT CTCCGCTGCG GGTCGCGATC ATAGGCGCGG GCCAGGTGGC GGATAAAGTT 
CATGCTTCGT ACTACTGCAC CCGCAACGAT CTGGAACTGG TGGCTGTCTG TGACAGCCGC 
CTTTCCCAGG CGCAGGCGCT GGCAGAAAAA TACGGGAATG CATCCGTGTG GGACGATCCG 
CAGGCCATGC TGCTGGCGGT GAAACCTGAT GTGGTTAGCG TCTGCTCACC TAACCGTTTT 
CATTACGAAC ATACCCTGAT GGCGCTGGAA GCGGGCTGCC ATGTGATGTG CGAAAAACCG 
CCCGCCATGA CGCCAGAACA GGCGCGGGAA ATGTGCGATA CCGCGCGCAA ACAGGGCAAG 
GTGCTGGCCT ACGACTTTCA CCATCGTTTT GCACTCGATA CGCAACAGCT GCGTGAACAG 
GTGACCAACG GCGTTTTGGG AGAGATTTAC GTTACCACCG CCCGCGCCCT GCGTCGCTGC 
GGCGTTCCCG GCTGGGGCGT TTTTACCAAT AAAGAATTGC AGGGCGGCGG GCCGCTTATT 
GACATCGGCA TTCATATGCT GGATGCGGCG ATGTATGTAC TGGGCTTTCC GGCGGTGAAA 
AGCGTGACCG CGCATAGCTT TCAAAAGATC GGCACACAAA AGAGCTGCGG TCAATTTGGC 
GAGTGGGACC CGGCAACCTA CAGCGTCGAA GATTCGCTGT TTGGCACCAT TGAATTTCAT 
AACGGCGGCA TTCTGTGGCT TGAGACCTCA TTTGCACTCA ACATCCGCGA ACAGTCGATT 
ATGAATGTCA GCTTTTGTGG TGATAAAGCC GGGGCGACGC TGTTTCCAGC ACATATCTAC 
ACCGATAACA ACGGTGAGTT AATGACGCTG ATGCAACGGG AAATGGCAGA CGACAACCGT 
CATCTGCGCA GTATGGAAGC CTTTATCAAC CACGTACAAG GTAAGCCCGT GATGATAGCC 
GACGCCGAGC AGGGGTACAT CATCCAGCAA CTGGTGGCGG CGTTGTATCA ATCCGCAGAA 
ACAGGGACGC GTGTGGAATT ATGA

Protein sequence

MTSSPLRVAI IGAGQVADKV HASYYCTRND LELVAVCDSR LSQAQALAEK YGNASVWDDP 
QAMLLAVKPD VVSVCSPNRF HYEHTLMALE AGCHVMCEKP PAMTPEQARE MCDTARKQGK 
VLAYDFHHRF ALDTQQLREQ VTNGVLGEIY VTTARALRRC GVPGWGVFTN KELQGGGPLI 
DIGIHMLDAA MYVLGFPAVK SVTAHSFQKI GTQKSCGQFG EWDPATYSVE DSLFGTIEFH 
NGGILWLETS FALNIREQSI MNVSFCGDKA GATLFPAHIY TDNNGELMTL MQREMADDNR 
HLRSMEAFIN HVQGKPVMIA DAEQGYIIQQ LVAALYQSAE TGTRVEL