Gene EcHS_A0581 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0581
Symbol	gcl
ID	5591961
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	593493
End bp	595274
Gene Length	1782 bp
Protein Length	593 aa
Translation table	11
GC content	53%
IMG OID	640919765
Product	glyoxylate carboligase
Protein accession	YP_001457348
Protein GI	157160030
COG category	[R] General function prediction only
COG ID	[COG3960] Glyoxylate carboligase
TIGRFAM ID	[TIGR01504] glyoxylate carboligase

Plasmid Coverage information

Num covering plasmid clones	55
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAAAA TGAGAGCCGT TGACGCGGCA ATGTATGTGC TGGAGAAAGA AGGTATCACC 
ACCGCCTTCG GTGTTCCGGG AGCTGCAATC AATCCGTTCT ACTCAGCGAT GCGTAAGCAC 
GGCGGTATTC GTCACATTCT GGCGCGTCAT GTGGAAGGTG CTTCGCACAT GGCGGAAGGT 
TATACCCGCG CAACGGCAGG AAATATCGGC GTATGTCTGG GGACTTCCGG TCCTGCGGGC 
ACGGACATGA TCACCGCGCT CTATTCCGCT TCTGCTGATT CCATTCCTAT TCTGTGCATT 
ACCGGCCAGG CACCGCGCGC CCGTCTGCAT AAAGAAGATT TTCAGGCCGT AGATATTGAA 
GCAATTGCTA AACCGGTCAG CAAAATGGCG GTTACAGTTC GTGAAGCGGC GCTGGTGCCT 
CGCGTGCTGC AACAGGCATT TCACCTGATG CGTTCTGGTC GTCCGGGTCC GGTACTGGTG 
GATTTACCGT TCGACGTTCA GGTTGCGGAA ATCGAGTTTG ATCCTGACAT GTACGAACCG 
CTGCCGGTCT ACAAACCTGC TGCCAGCCGT ATGCAGATCG AAAAAGCTGT AGAAATGTTA 
ATCCAGGCCG AACGTCCGGT GATTGTTGCC GGGGGCGGGG TAATTAATGC TGACGCAGCT 
GCACTGTTAC AACAGTTTGC TGAACTGACC AGCGTTCCGG TGATCCCAAC GCTGATGGGC 
TGGGGCTGTA TCCCGGACGA TCATGAACTG ATGGCCGGGA TGGTGGGTCT GCAAACCGCG 
CATCGTTACG GTAACGCAAC GTTGCTGGCG TCCGACATGG TGTTTGGTAT CGGTAACCGT 
TTTGCTAACC GTCATACCGG TTCGGTAGAG AAATACACCG AAGGGCGCAA AATCGTTCAT 
ATCGATATTG AGCCGACGCA AATTGGCCGC GTGCTGTGTC CGGATCTGGG GATTGTCTCT 
GATGCTAAAG CGGCGCTGAC ACTGCTGGTT GAAGTGGCGC AGGAAATGCA AAAAGCAGGG 
CGTCTGCCAT GCCGTAAAGA GTGGGTTGCT GAGTGCCAGC AGCGCAAACG TACTTTGTTG 
CGTAAAACAC ACTTCGACAA CGTGCCGGTG AAACCGCAGC GCGTGTATGA AGAGATGAAC 
AAAGCTTTTG GACGTGATGT TTGCTATGTC ACCACCATTG GTCTGTCGCA AATTGCCGCT 
GCGCAAATGC TGCATGTCTT TAAAGACCGC CACTGGATCA ACTGTGGTCA GGCTGGTCCG 
TTAGGCTGGA CGATTCCGGC TGCGCTAGGG GTTTGTGCCG CTGATCCGAA ACGCAATGTG 
GTGGCGATTT CTGGCGACTT TGACTTCCAG TTCCTGATTG AAGAGTTAGC CGTTGGCGCG 
CAGTTCAAAA TTCCGTACAT CCATGTACTG GTCAATAACG CTTATCTGGG GCTGATTCGC 
CAGTCGCAGC GCGCGTTTGA TATGGACTAC TGCGTGCAAC TCGCTTTCGA GAATATCAAC 
TCCAGCGAAG TGAACGGTTA CGGCGTCGAC CACGTAAAAG TAGCGGAAGG TTTAGGTTGT 
AAAGCGATTC GCGTCTTCAA ACCGGAAGAT ATTGCGCCAG CCTTTGAACA GGCGAAAGCC 
TTAATGGCGC AATATCGGGT ACCGGTAGTC GTGGAAGTTA TTCTCGAGCG TGTGACCAAT 
ATTTCGATGG GCAGCGAACT GGATAACGTC ATGGAATTTG AAGATATCGC CGATAACGCA 
GCGGACGCAC CGACTGAAAC CTGCTTCATG CACTATGAAT AA

Protein sequence

MAKMRAVDAA MYVLEKEGIT TAFGVPGAAI NPFYSAMRKH GGIRHILARH VEGASHMAEG 
YTRATAGNIG VCLGTSGPAG TDMITALYSA SADSIPILCI TGQAPRARLH KEDFQAVDIE 
AIAKPVSKMA VTVREAALVP RVLQQAFHLM RSGRPGPVLV DLPFDVQVAE IEFDPDMYEP 
LPVYKPAASR MQIEKAVEML IQAERPVIVA GGGVINADAA ALLQQFAELT SVPVIPTLMG 
WGCIPDDHEL MAGMVGLQTA HRYGNATLLA SDMVFGIGNR FANRHTGSVE KYTEGRKIVH 
IDIEPTQIGR VLCPDLGIVS DAKAALTLLV EVAQEMQKAG RLPCRKEWVA ECQQRKRTLL 
RKTHFDNVPV KPQRVYEEMN KAFGRDVCYV TTIGLSQIAA AQMLHVFKDR HWINCGQAGP 
LGWTIPAALG VCAADPKRNV VAISGDFDFQ FLIEELAVGA QFKIPYIHVL VNNAYLGLIR 
QSQRAFDMDY CVQLAFENIN SSEVNGYGVD HVKVAEGLGC KAIRVFKPED IAPAFEQAKA 
LMAQYRVPVV VEVILERVTN ISMGSELDNV MEFEDIADNA ADAPTETCFM HYE