Gene EcolC_0562 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0562
Symbol
ID	6064387
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	605230
End bp	606384
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	56%
IMG OID	641599969
Product	AgaS family sugar isomerase
Protein accession	YP_001723566
Protein GI	170018612
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2222] Predicted phosphosugar isomerases
TIGRFAM ID	[TIGR02815] putative sugar isomerase, AgaS family

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAAAAA ATTACACCCC TGCTGCTGCC GCAACCGGTA CATGGACTGA AGAAGAGATC 
CGCCATCAGC CTCGCGCATG GATCCGTTCA CTCACCAACA TCGACGCGCT ACGTTCCGCG 
CTCAATAACT TCCTTGAACC GTTACTGCGC AAAGAGAATC TGCGGATCAT CCTGACCGGA 
GCCGGAACCT CGGCATTTAT CGGTGACATC ATCGCGCCGT GGCTCGCCAG CCATACCGGT 
AAAAACTTCA GCGCCGTACC GACCACCGAT CTGGTCACTA ATCCGATGGA CTACCTGAAC 
CCAGCCCATC CGCTGCTGTT GATCTCCTTC GGTCGATCCG GCAACAGCCC GGAAAGCGTC 
GCAGCCGTGG AACTGGCAAA TCAATTTGTA CCGGAATGCT ATCACCTGCC GATCACCTGC 
AACGAAGCGG GCGCTCTTTA CCAAAACGCG ATCAACAGCG ATAACGCGTT TGCCCTGCTG 
ATGCCCGCAG AAACGCACGA TCGCGGCTTT GCGATGACCA GCAGCATTAC CACCATGATG 
GCCAGCTGCC TCGCGGTTTT CGCACCTGAG ACGATCAACA GCCAAACCTT CCGCGACGTG 
GCGGATCGTT GCCAGGCGAT CCTGACCTCA CTGGGCGATT TCAGCGAAGG TGTGTTTGGT 
TACGCACCGT GGAAACGGAT CGTTTATCTC GGTAGCGGTG GCTTACAGGG CGCAGCACGC 
GAGTCGGCGC TGAAAGTGCT GGAACTGACG GCGGGTAAAC TGGCGGCCTT TTATGATTCT 
CCAACCGGAT TCCGTCATGG ACCAAAATCG CTGGTCGATG ACGAAACGCT GGTGGTGGTA 
TTTGTCTCCA GCCACCCTTA CACCCGTCAG TATGATCTTG ATCTGCTGGC TGAACTTCGC 
CGTGACAACC AGGCAATGCG TGTAATCGCC ATCGCCGCGG AAAGCAGCGA CATCGTCGCT 
GCCGGTCCAC ATATCATCCT GCCACCGTCA CGTCACTTTA TCGACGTTGA GCAGGCATTT 
TGCTTCCTGA TGTACGCCCA GACGTTTGCA CTGATGCAGT CGCTGCACAT GGGCAATACG 
CCGGATACCC CATCAGCCAG TGGCACCGTT AACCGCGTGG TGCAAGGCGT AATCATTCAT 
CCGTGGCAGG CATAA

Protein sequence

MPKNYTPAAA ATGTWTEEEI RHQPRAWIRS LTNIDALRSA LNNFLEPLLR KENLRIILTG 
AGTSAFIGDI IAPWLASHTG KNFSAVPTTD LVTNPMDYLN PAHPLLLISF GRSGNSPESV 
AAVELANQFV PECYHLPITC NEAGALYQNA INSDNAFALL MPAETHDRGF AMTSSITTMM 
ASCLAVFAPE TINSQTFRDV ADRCQAILTS LGDFSEGVFG YAPWKRIVYL GSGGLQGAAR 
ESALKVLELT AGKLAAFYDS PTGFRHGPKS LVDDETLVVV FVSSHPYTRQ YDLDLLAELR 
RDNQAMRVIA IAAESSDIVA AGPHIILPPS RHFIDVEQAF CFLMYAQTFA LMQSLHMGNT 
PDTPSASGTV NRVVQGVIIH PWQA