Gene EcHS_A2296 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2296
Symbol
ID	5591813
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	2293927
End bp	2295015
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	52%
IMG OID	640921424
Product	hypothetical protein
Protein accession	YP_001458960
Protein GI	157161642
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0524] Sugar kinases, ribokinase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	58
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAACC GGGAAAAGGA GATCCTTGCA ATTTTACGGC GTAACCCGCT GATTCAGCAG 
AACGAAATTG CGGACATGCT GCAAATCAGT CGTTCGCGCG TTGCGGCGCA TATTATGGAT 
TTAATGCGCA AAGGGCGGAT TAAAGGCAAA GGTTACATTC TCACCGAGCA GGAATACTGC 
GTAGTGGTGG GGACAATCAA TATGGATATT CGCGGGATGG CGGATATCCG TTACCCGCAA 
GCGGCTTCTC ATCCCGGTAC AATTCATTGC TCGGCGGGCG GCGTGGGACG CAACATCGCC 
CACAATCTGG CGCTGTTAGG CCGTGACGTC CATTTGCTTT CAGTGATTGG CGATGACTTT 
TATGGCGAAA TGCTCCTGGA AGAAACGCGC CGTGCCGGCG TGAATGTCTC CGGCTGCGTT 
CGTTTGCATG GTCAAAGCAC ATCGACGTAT CTGGCAATTG CCAATCGAGA CGATCAAACC 
GTGCTGGCGA TTAACGATAC CCATCTGCTG GAACAGTTGA CACCGCAACT ACTGAACGGG 
TCGCGCGATT TACTTCGTCA TGCGGGCGTG GTACTGGCTG ATTGCAACCT GACAGCCGAG 
GCGCTGGAAT GGGTCTTTAC CCTCGCTGAT GAAATCCCGG TGTTTGTCGA TACCGTTTCA 
GAATTCAAAG CGGGCAAAAT CAAACACTGG CTGGCGCATA TTCACACCCT GAAACCCACT 
TTACCGGAGC TGGAAATTTT ATGGGGACAG GCGATCACCA GCGATGCTGA CCGTAATGCC 
GCAGTGAATG CATTGCATCA GCAAGGTGTT CAGCAACTGT TTGTTTATTT GCCCGATGAG 
TCAGTTTATT GCAGCGAAAA GGATGGAGAA CAATTTTTGC TGACCGCGCC AGCGCATACG 
ACAGTAGACA GTTTTGGTGC TGACGATGGT TTTATGGCGG GCCTGGTATA TAGCTTTCTT 
GAAGGATACA GTTTCCGCGA CAGCGCCCGT TTTGCGGTAG CCTGCGCGGC AATTTCGCGC 
GCCAGCGGCA GCTTAAACAA CCCTACCCTG TCTGCCGATA ACGCGCTTTC ATTAGTGCCA 
ATGGTGTAA

Protein sequence

MNNREKEILA ILRRNPLIQQ NEIADMLQIS RSRVAAHIMD LMRKGRIKGK GYILTEQEYC 
VVVGTINMDI RGMADIRYPQ AASHPGTIHC SAGGVGRNIA HNLALLGRDV HLLSVIGDDF 
YGEMLLEETR RAGVNVSGCV RLHGQSTSTY LAIANRDDQT VLAINDTHLL EQLTPQLLNG 
SRDLLRHAGV VLADCNLTAE ALEWVFTLAD EIPVFVDTVS EFKAGKIKHW LAHIHTLKPT 
LPELEILWGQ AITSDADRNA AVNALHQQGV QQLFVYLPDE SVYCSEKDGE QFLLTAPAHT 
TVDSFGADDG FMAGLVYSFL EGYSFRDSAR FAVACAAISR ASGSLNNPTL SADNALSLVP 
MV