Gene ECH74115_2984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_2984
Symbol	cpsB
ID	6967001
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	2763291
End bp	2764727
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	56%
IMG OID	643386824
Product	mannose-1-phosphate guanylyltransferase
Protein accession	YP_002271292
Protein GI	209396318
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0662] Mannose-6-phosphate isomerase [COG0836] Mannose-1-phosphate guanylyltransferase
TIGRFAM ID	[TIGR01479] mannose-1-phosphate guanylyltransferase/mannose-6-phosphate isomerase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.000133509
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCGCAGT CGAAACTCTA TCCAGTTGTG ATGGCAGGTG GCTCCGGTAG CCGCTTATGG 
CCGCTTTCCC GCGTACTTTA TCCCAAGCAG TTTTTATGCC TGAAAGGCGA TCTCACCATG 
CTGCAAACCA CCATCTGCCG CCTGAACGGC GTGGAGTGCG AAAGCCCTGT GGTGATTTGC 
AATGAGCAGC ACCGCTTTAT TGTTGCGGAA CAACTGCGTC AACTGAACAA ACTCACTGAG 
AACATTATTC TCGAACCGGC AGGGCGTAAC ACAGCACCGG CCATTGCGCT GGCGGCGCTG 
GCGGCAAAAC GTCATAGCCC GGAGAACGAC CCATTAATGC TGGTGCTGGC GGCGGATCAT 
GTGATTGCCG ATGAAGACGC ATTCCGCGCC GCCGTGCGTA ACGCTATGCC GTATGCCGAA 
GCGGGCAAGC TGGTGACCTT CGGCATTGTG CCGGATCTAC CTGAAACCGG ATATGGCTAT 
ATTCGTCGCG GTGAAGTGTC GGCGGGTGAG CAGGATACGG TGGCCTTTGA AGTGGCGCAG 
TTTGTCGAAA AACCAAATCT GGAAACCGCG CAGGCCTATG TGGCAAGCGG CGAATATTAC 
TGGAACAGCG GTATGTTCCT GTTCCGTGCC GGACGCTATC TCGAAGAACT GAAAAAATAT 
CGCCCGGATA TTCTCGACGC CTGTGAAAAA GCGATGAGCG CCGTCGATCC GGATCTCGAT 
TTTATTCGCG TGGATGAAGA CGCGTTTCTG GCCTGCCCGG AAGAGTCGGT GGATTACGCG 
GTCATGGAAC GTACGGCAGA TGCCGTTGTG GTGCCGATGG ATGCGGGCTG GAGCGATGTC 
GGCTCCTGGT CCTCATTATG GGAGATCAGC GCCCACACCG CCGAGGGCAA CGTTTGCCAC 
GGCGATGTGA TTAATCACAA AACTGAAAAC AGCTATGTGT ATGCCGAATC TGGCCTGGTC 
ACCACCGTCG GGGTGAAAGA TTTGGTGGTA GTGCAGACCA AAGATGCGGT GCTGATTGCC 
GACCGTAACG CGGTGCAGGA TGTGAAAAAA GTGGTCGAGC AGATCAAAGC CGATGGTCGC 
CATGAGCATC GGGTGCATCG CGAAGTCTAT CGCCCGTGGG GCAAATATGA CTCTATCGAC 
GCGGGCGACC GCTACCAGGT GAAACGCATC ACCGTGAAAC CGGGCGAAGG CTTGTCGGTA 
CAGATGCACC ATCACCGCGC GGAACACTGG GTGGTTGTCG CGGGAACGGC AAAAGTCACC 
ATTGACGGTG ATATCAAACT GCTTGGTGAA AACGAGTCGA TTTATATTCC GCTGGGGGCG 
ACGCACTGCC TGGAAAACCC GGGGAAAATT CCGCTCGATT TAATTGAAGT GCGCTCCGGC 
TCTTATCTCG AAGAGGATGA TGTGGTGCGC TTCGCGGATC GCTACGGACG GGTGTAA

Protein sequence

MAQSKLYPVV MAGGSGSRLW PLSRVLYPKQ FLCLKGDLTM LQTTICRLNG VECESPVVIC 
NEQHRFIVAE QLRQLNKLTE NIILEPAGRN TAPAIALAAL AAKRHSPEND PLMLVLAADH 
VIADEDAFRA AVRNAMPYAE AGKLVTFGIV PDLPETGYGY IRRGEVSAGE QDTVAFEVAQ 
FVEKPNLETA QAYVASGEYY WNSGMFLFRA GRYLEELKKY RPDILDACEK AMSAVDPDLD 
FIRVDEDAFL ACPEESVDYA VMERTADAVV VPMDAGWSDV GSWSSLWEIS AHTAEGNVCH 
GDVINHKTEN SYVYAESGLV TTVGVKDLVV VQTKDAVLIA DRNAVQDVKK VVEQIKADGR 
HEHRVHREVY RPWGKYDSID AGDRYQVKRI TVKPGEGLSV QMHHHRAEHW VVVAGTAKVT 
IDGDIKLLGE NESIYIPLGA THCLENPGKI PLDLIEVRSG SYLEEDDVVR FADRYGRV