Gene EcolC_1046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1046
Symbol
ID	6066419
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1132920
End bp	1134188
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	57%
IMG OID	641600459
Product	hydroxyglutarate oxidase
Protein accession	YP_001724042
Protein GI	170019088
COG category	[R] General function prediction only
COG ID	[COG0579] Predicted dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATGATT TTGTGATTAT TGGCGGTGGC ATCATCGGCA TGTCGACCGC CATGCAACTG 
ATTGATGTCT ACCCGGACGC CCGCATTGCG TTGCTGGAAA AAGAGTCCGG CCCGGCCTGT 
CACCAGACGG GCCACAACAG CGGCGTGATC CATGCCGGGG TTTATTACAC GCCCGGTAGC 
CTGAAGGCAC AGTTTTGCCT GGCGGGAAAC CGCGCCACTA AAGCCTTTTG CGATCAAAAC 
GGCATTCGCT ATGACAACTG CGGCAAGATG CTGGTCGCCA CCTCTGAACT CGAAATGGAA 
CGGATGCGCG CGTTGTGGGA ACGCACGGCG GCAAACGGTA TCGAGCGCGA GTGGTTAAAC 
GCCGATGAAC TGCGCGAGCG CGAACCGAAT ATCACCGGGC TTGGCGGTAT TTTTGTGCCG 
TCCAGCGGCA TTGTCAGCTA CCGCGAAGTA ACGGCGGCGA TGGCAAAAAT TTTCCAGGCC 
AGAGGCGGCG AGATTATCTA TAACGCCGAA GTCAGCGGCC TCAGTGAGCA TAAAAACGGC 
GTGGTGATAC GTACCCGCCA GGGCGGCGAA TATGAAGCAT CGACGCTGAT TAGCTGTTCC 
GGGCTGATGG CTGACCGGCT GGTGAAAATG CTCGGACTCG AACCGGGCTT TATCATCTGC 
CCGTTCCGTG GTGAGTATTT CCGCCTTGCG CCGGAGCATA ACCAGATTGT TAACCACCTG 
ATTTACCCCA TTCCCGACCC CGCGATGCCA TTTTTGGGCG TGCATCTCAC CCGAATGATC 
GATGGCAGCG TGACCGTCGG GCCAAACGCG GTGCTGGCTT TTAAACGCGA AGGCTACCAC 
AAGCGCGACT TCTCGTTTAG CGACACGCTG GAAATTTTGG GCTCGTCGGG GATTCGCCGG 
GTGCTGCAAA ACCATCTACG CTCAGGACTG GGCGAGATGA AAAACTCGCT GTGCAAAAGC 
GGCTATCTGC GGCTGGTGCA AAAGTATTGT CCCCGGCTTT CGTTAAGCGA TCTCCAGCCC 
TGGCCCGCCG GTGTGCGGGC GCAGGCGGTA TCGCCGGACG GCAAGCTGAT TGACGATTTT 
CTGTTTGTCA CCACCCCGCG CACGATCCAC ACCTGCAATG CGCCCTCCCC GGCAGCGACA 
TCAGCAATTC CTATTGGTGC GCATATTGTC AGCAAGGTAC AAACGCTGTT GGCAAGCCAG 
AGTAACCCCG GACGCACGCT GCGAGCGGCA CGTAGTGTGG ATGCCTTACA CGCCGCATTT 
AATCAATAA

Protein sequence

MYDFVIIGGG IIGMSTAMQL IDVYPDARIA LLEKESGPAC HQTGHNSGVI HAGVYYTPGS 
LKAQFCLAGN RATKAFCDQN GIRYDNCGKM LVATSELEME RMRALWERTA ANGIEREWLN 
ADELREREPN ITGLGGIFVP SSGIVSYREV TAAMAKIFQA RGGEIIYNAE VSGLSEHKNG 
VVIRTRQGGE YEASTLISCS GLMADRLVKM LGLEPGFIIC PFRGEYFRLA PEHNQIVNHL 
IYPIPDPAMP FLGVHLTRMI DGSVTVGPNA VLAFKREGYH KRDFSFSDTL EILGSSGIRR 
VLQNHLRSGL GEMKNSLCKS GYLRLVQKYC PRLSLSDLQP WPAGVRAQAV SPDGKLIDDF 
LFVTTPRTIH TCNAPSPAAT SAIPIGAHIV SKVQTLLASQ SNPGRTLRAA RSVDALHAAF 
NQ