Gene EcSMS35_0620 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0620
Symbol
ID	6144000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	633243
End bp	634331
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	56%
IMG OID	641615512
Product	hypothetical protein
Protein accession	YP_001742718
Protein GI	170684067
COG category	[C] Energy production and conversion
COG ID	[COG0371] Glycerol dehydrogenase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.505795
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTCACA ATCCTATCCG CGTGGTCGTC GGCCCGGCTA ACTACTTTTC ACATCCCGGA 
AGTTTCAATC ACCTGCACGA TTTTTTCACT GATGAACAAC TTTCTCGCGC GGCGTGGATC 
TACGGCGAAC GCGCCATTGC TGCGGCGCAA ACAAAACTTC CGCCAGCGTT TGAACTGCCA 
GGGGCAAAGC ATATTTTGTT TCGTGGTCAT TGCAGCGAAA GCGATGTACA ACAACTGGCG 
GCTGAGTCCG GTGACGATCG CAGCGTGGTG ATTGGCGTCG GCGGCGGCGC ACTGCTCGAC 
ACCGCGAAAG CCCTCGCCCG CCGTCTCGGT CTGCCGTTTG TTGCCGTTCC GACGATCGCC 
GCTACCTGCG CAGCCTGGAC ACCGCTCTCT GTCTGGTACA ACGATGCCGG ACAAGCGCTG 
CATTATGAGA TTTTCGACGA CGCCAATTTT ATGGTGCTGG TGGAACCGGA GATTATCCTC 
AACGCGCCGC AAGAATATCT GCTGGCGGGG ATCGGTGACA CGCTGGCGAA ATGGTATGAA 
GCGGTGGTGC TGGCCCCGCA ACCAGAAACG TTGCCGTTAA CCGTGCGGCT GGGGATTAAT 
AACGCGCAGG CCATTCGCGA CGTCTTGTTA AACAGTAGCG AACAGGCGCT TGCCGATCAG 
CAAAATCACC AGTTAACGCA ATCATTTTGC GATGTGGTGG ATGCCATTAT TGCTGGTGGT 
GGGATGGTTG GTGGTCTGGG CGATCGTTTT ACGCGTGTGG CGGCAGCTCA TGCCGTGCAT 
AACGGTCTGA CCGTGCTGCC GCAAACCGAG AAGTTTCTCC ACGGCACCAA AGTCGCCTAC 
GGAATTCTGG TGCAAAGCGC CTTGCTGGGT CAGGATGATG TGCTGGCGCA ATTAACTGGA 
GCGTATCAGC GTTTTCATCT GCCGACTACG CTGGCGGAGC TGGAAGTGGA TATCAATAAT 
CAGGCGGAGA TCGACAAAGT GATTGCCCAC ACCTTACGTC CGGTGGAATC CATTCATTAC 
CTGCCGGTCA CGCTGACACC AGATACGTTG CGTGCAGCGT TCGAAAAAGT GGAATCGTTT 
AAAGCCTGA

Protein sequence

MPHNPIRVVV GPANYFSHPG SFNHLHDFFT DEQLSRAAWI YGERAIAAAQ TKLPPAFELP 
GAKHILFRGH CSESDVQQLA AESGDDRSVV IGVGGGALLD TAKALARRLG LPFVAVPTIA 
ATCAAWTPLS VWYNDAGQAL HYEIFDDANF MVLVEPEIIL NAPQEYLLAG IGDTLAKWYE 
AVVLAPQPET LPLTVRLGIN NAQAIRDVLL NSSEQALADQ QNHQLTQSFC DVVDAIIAGG 
GMVGGLGDRF TRVAAAHAVH NGLTVLPQTE KFLHGTKVAY GILVQSALLG QDDVLAQLTG 
AYQRFHLPTT LAELEVDINN QAEIDKVIAH TLRPVESIHY LPVTLTPDTL RAAFEKVESF 
KA