Gene EcHS_A3150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3150
Symbol	glcF
ID	5593710
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3161870
End bp	3163093
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	56%
IMG OID	640922270
Product	glycolate oxidase iron-sulfur subunit
Protein accession	YP_001459768
Protein GI	157162450
COG category	[C] Energy production and conversion
COG ID	[COG0247] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	74
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAACCC AATTAACTGA AGAGATGCGG CAGAACGCGC GCGCGCTGGA AGCCGACAGC 
ATCCTGCGCG CCTGTGTTCA CTGCGGATTT TGTACCGCAA CCTGCCCAAC CTATCAGCTT 
CTGGGCGATG AACTGGACGG GCCGCGCGGG CGCATCTATC TGATTAAACA GGTGCTGGAA 
GGCAACGAAG TCACGCTTAA AACACAGGAG CATCTCGATC GCTGCCTCAC TTGCCGTAAT 
TGTGAAACCA CCTGTCCTTC TGGTGTGCGC TATCACAATT TGCTGGATAT CGGGCGTGAT 
ATTGTCGAGC AGAAAGTGAA ACGCCCACTG CCGGAGCGAA TACTGCGCGA AGGATTGCGC 
CAGGTAGTGC CGCGTCCGGC GGTCTTCCGT GCGCTGACGC AGGTAGGGCT GGTGCTGCGA 
CCGTTTTTAC CGGAACAGGT CAGAGCAAAA CTGCCTGCTG AAACGGTGAA AGCTAAACCG 
CGTCCGCCGC TGCGCCATAA GCGTCGGGTT TTAATGTTGG AAGGCTGCGC CCAGCCTACG 
CTTTCGCCCA ACACCAACGC GGCAACTGCG CGAGTGCTGG ATCGTCTGGG GATCAGCGTC 
ATGCCAGCTA ACGAAGCAGG CTGTTGTGGC GCGGTGGACT ATCATCTTAA TGCGCAGGAG 
AAAGGGCTGG CACGGGCGCG CAATAATATT GATGCCTGGT GGCCCGCGAT TGAAGCAGGT 
GCCGAGGCAA TTTTGCAAAC CGCCAGCGGC TGCGGCGCGT TTGTCAAAGA GTATGGGCAG 
ATGCTGAAAA ACGATGCGTT ATATGCCGAT AAAGCGCGTC AGGTCAGTGA ACTGGCGGTC 
GATTTAGTCG AACTTCTGCG CGAGGAACCG CTGGAAAAAC TGGCAATTCG CGGCGATAAA 
AAGCTGGCCT TCCACTGTCC GTGTACCCTA CAACATGCGC AAAAGCTGAA CGGCGAAGTG 
GAAAAAGTGT TGCTTCGTCT TGGATTTACC TTAACGGACG TTCCCGACAG CCATCTGTGC 
TGCGGTTCAG CGGGAACATA TGCGTTAACG CATCCCGATC TGGCACGCCA GCTGCGGGAT 
AACAAAATGA ATGCGCTGGA AAGCGGCAAA CCGGAAATGA TCGTCACCGC CAACATTGGT 
TGCCAGACGC ATCTGGCGAG CGCCGGTCGT ACCTCTGTGC GTCACTGGAT TGAAATTGTA 
GAACAAGCCC TTGAAAAGGA ATAA

Protein sequence

MQTQLTEEMR QNARALEADS ILRACVHCGF CTATCPTYQL LGDELDGPRG RIYLIKQVLE 
GNEVTLKTQE HLDRCLTCRN CETTCPSGVR YHNLLDIGRD IVEQKVKRPL PERILREGLR 
QVVPRPAVFR ALTQVGLVLR PFLPEQVRAK LPAETVKAKP RPPLRHKRRV LMLEGCAQPT 
LSPNTNAATA RVLDRLGISV MPANEAGCCG AVDYHLNAQE KGLARARNNI DAWWPAIEAG 
AEAILQTASG CGAFVKEYGQ MLKNDALYAD KARQVSELAV DLVELLREEP LEKLAIRGDK 
KLAFHCPCTL QHAQKLNGEV EKVLLRLGFT LTDVPDSHLC CGSAGTYALT HPDLARQLRD 
NKMNALESGK PEMIVTANIG CQTHLASAGR TSVRHWIEIV EQALEKE