Gene EcolC_1488 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1488
Symbol
ID	6067137
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1642336
End bp	1643424
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	52%
IMG OID	641600907
Product	hypothetical protein
Protein accession	YP_001724477
Protein GI	170019523
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0524] Sugar kinases, ribokinase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.000467798
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00751025
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATAACC GGGAAAAGGA GATCCTTGCA ATTTTACGGC GTAACCCGCT GATTCAGCAG 
AACGAAATTG CGGACATGCT GCAAATCAGT CGTTCGCGCG TTGCGGCGCA TATTATGGAT 
TTAATGCGCA AAGGGCGGAT TAAAGGCAAA GGTTACATTC TCACCGAGCA GGAATACTGC 
GTAGTGGTGG GGACAATCAA TATGGATATT CGCGGGATGG CGGATATCCG TTACCCGCAA 
GCGGCTTCTC ATCCCGGTAC AATTCATTGC TCGGCGGGCG GCGTGGGACG CAACATCGCC 
CACAATCTGG CGCTGTTAGG CCGTGACGTC CATTTGCTTT CAGTGATTGG CGATGACTTT 
TATGGCGAAA TGCTCCTGGA AGAAACGCGC CGTGCCGGCG TGAATGTCTC CGGCTGCGTT 
CGTTTGCATG GTCAAAGCAC ATCGACGTAT CTGGCAATTG CCAATCGAGA CGATCAAACC 
GTGCTGGCGA TTAACGATAC CCATCTGCTG GAACAGTTGA CACCGCAACT ACTGAACGGG 
TCGCGCGATT TACTTCGTCA TGCGGGCGTG GTACTGGCTG ATTGCAACCT GACAGCCGAG 
GCGCTGGAAT GGGTCTTTAC CCTCGCTGAT GAAATCCCGG TGTTTGTCGA TACCGTTTCA 
GAATTCAAAG CGGGCAAAAT CAAACACTGG CTGGCGCATA TTCACACCCT GAAACCCACT 
TTACCGGAGC TGGAAATTTT ATGGGGACAG GCGATCACCA GCGATGCTGA CCGTAATGCC 
GCAGTGAATG CATTGCATCA GCAAGGTGTT CAGCAACTGT TTGTTTATTT GCCCGATGAG 
TCAGTTTATT GCAGCGAAAA GGATGGAGAA CAATTTTTGC TGACCGCGCC AGCGCATACG 
ACAGTAGACA GTTTTGGTGC TGACGATGGT TTTATGGCGG GCCTGGTATA TAGCTTTCTT 
GAAGGATACA GTTTCCGCGA CAGCGCCCGT TTTGCGGTAG CCTGCGCGGC AATTTCGCGC 
GCCAGCGGCA GCTTAAACAA CCCTACCCTG TCTGCCGATA ACGCGCTTTC ATTAGTGCCA 
ATGGTGTAA

Protein sequence

MNNREKEILA ILRRNPLIQQ NEIADMLQIS RSRVAAHIMD LMRKGRIKGK GYILTEQEYC 
VVVGTINMDI RGMADIRYPQ AASHPGTIHC SAGGVGRNIA HNLALLGRDV HLLSVIGDDF 
YGEMLLEETR RAGVNVSGCV RLHGQSTSTY LAIANRDDQT VLAINDTHLL EQLTPQLLNG 
SRDLLRHAGV VLADCNLTAE ALEWVFTLAD EIPVFVDTVS EFKAGKIKHW LAHIHTLKPT 
LPELEILWGQ AITSDADRNA AVNALHQQGV QQLFVYLPDE SVYCSEKDGE QFLLTAPAHT 
TVDSFGADDG FMAGLVYSFL EGYSFRDSAR FAVACAAISR ASGSLNNPTL SADNALSLVP 
MV