Gene EcSMS35_2780 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2780
Symbol
ID	6146911
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	2863598
End bp	2864866
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	57%
IMG OID	641617649
Product	hydroxyglutarate oxidase
Protein accession	YP_001744809
Protein GI	170682247
COG category	[R] General function prediction only
COG ID	[COG0579] Predicted dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.582782
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATGATT TTGTGATTAT TGGCGGCGGC ATCATCGGCA TGTCGACCGC CATGCAACTG 
ATTGATGTTT ATCCGGATGC CCGCATTGCG TTGCTGGAAA AAGAGTCCGG CCCGGCCTTT 
CATCAGACGG GCCACAACAG CGGCGTGATC CATGCCGGGG TCTATTACAC GCCCGGTAGC 
CTGAAGGCAC AGTTTTGCCT GGCGGGAAAC CGCGCCACCA AAGCCTTTTG CGATCAAAAC 
GGCATTCGCT ATGACAACTG CGGCAAGATG CTGGTCGCCA CCTCTGAACT CGAAATGGAA 
CGGATGCGCG CGTTGTGGGA ACGCACGGCG GCGAACGGTA TCGAGCGCGA GTGGTTAAAC 
GCCGAGGAAC TGCGCGAGCG CGAACCGAAT ATCACCGGGC TCGGCGGCAT TTTTGTGCCG 
TCCAGCGGCA TTGTCAGCTA TCGCGAAGTG ACGGCGGCGA TGGCAAAAAT CTTCCAGGCC 
AGAGGCGGCG AGATTATTTA TAACGCCGAA GTCAGCGCCC TCAGTGAGCA TAAAAACGGC 
GTGGTGATAC GTACCCGTCA GGGCGGTGAA TATGAAGCAT CGACGCTGAT TAGCTGTTCC 
GGGCTGATGG CTGACCGGCT GGTGAAAATG CTCGGCCTCG AACCGGGCTT TATTATCTGC 
CCGTTCCGTG GCGAGTATTT CCGCCTTGCG CCGGAGCATA ACCAGATTGT TAACCACCTG 
ATTTACCCCA TTCCCGACCC CGCGATGCCA TTTTTGGGCG TGCATCTCAC CCGCATGATC 
GATGGCAGCG TGACCGTCGG GCCAAACGCG GTGCTGGCTT TTAAACGCGA AGGCTATCGC 
AAGCGCGATT TCTCGTTTAG TGACACGCTG GAGATTTTAG GCTCGTCGGG GATTCGCCGG 
GTGCTGCAAA ACCATCTACG CTCAGGATTG GGCGAGATGA AAAACTCGCT GTGCAAAAGC 
GGCTATCTGC GGCTGGTGCA AAAGTATTGT CCCCGGCTTT CGTTAAGCGA TCTCCAGCCC 
TGGCCCGCAG GTGTGCGGGC GCAGGCGGTA TCGCCGGACG GCAAGCTGAT TGACGATTTT 
CTGTTTGTCA CCACCCCGCG CACGATCCAC ACCTGCAATG CGCCCTCCCC GGCAGCGACA 
TCAGCAATTC CTATTGGTGC GCATATTGTC AGCAAGGTAC AAACGCTGTT GGCAAGCCAG 
AGTAACCCCG GACGCACGCT GCGAGCGGCA CGTAGTGTGG ATGCCTTACA CGCCGCATTT 
AATCAATAA

Protein sequence

MYDFVIIGGG IIGMSTAMQL IDVYPDARIA LLEKESGPAF HQTGHNSGVI HAGVYYTPGS 
LKAQFCLAGN RATKAFCDQN GIRYDNCGKM LVATSELEME RMRALWERTA ANGIEREWLN 
AEELREREPN ITGLGGIFVP SSGIVSYREV TAAMAKIFQA RGGEIIYNAE VSALSEHKNG 
VVIRTRQGGE YEASTLISCS GLMADRLVKM LGLEPGFIIC PFRGEYFRLA PEHNQIVNHL 
IYPIPDPAMP FLGVHLTRMI DGSVTVGPNA VLAFKREGYR KRDFSFSDTL EILGSSGIRR 
VLQNHLRSGL GEMKNSLCKS GYLRLVQKYC PRLSLSDLQP WPAGVRAQAV SPDGKLIDDF 
LFVTTPRTIH TCNAPSPAAT SAIPIGAHIV SKVQTLLASQ SNPGRTLRAA RSVDALHAAF 
NQ