Gene ECH74115_1264 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1264
Symbol	pgaC
ID	6967460
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	1271750
End bp	1272988
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	47%
IMG OID	643385254
Product	N-glycosyltransferase
Protein accession	YP_002269749
Protein GI	209395977
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	0.498109
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAGGT TCGTTTTCTT CTGGCCGTTT TTTATGTCCA TTATGTGGAT TGTTGGCGGC 
GTCTATTTCT GGGTCTATCG TGAACGCCGC TGGCCGTGGG GAGAAAACGC ACCAGCTCCC 
CAGTTGAAAG ATAATCCGTC TATCTCCATT ATCATTCCCT GTTTTAATGA GGAGAAAAAC 
GTTGAGGAAA CCATACACGC CGCTTTAGCA CAGCGTTATG AGAACATTGA AGTTATTGCC 
GTAAATGACG GTTCAACAGA TAAAACCCGT GCCATCCTGG ATCGCATGGC TGCACAAATT 
CCCCATTTGC GGGTCATTCA TCTGGCGCAA AACCAGGGGA AAGCCATTGC GCTTAAAACC 
GGAGCTGCCG CGGCGAAAAG TGAATATCTG GTGTGCATTG ATGGCGATGC GTTATTAGAC 
CGCGATGCGG CGGCATATAT TGTGGAACCG ATGTTGTACA ACCCGCGTGT GGGTGCCGTA 
ACCGGTAATC CTCGTATTCG AACACGTTCT ACCCTGGTGG GTAAAATTCA GGTTGGCGAG 
TATTCCTCAA TTATTGGTTT GATCAAGCGA ACCCAGCGTA TCTATGGAAA CGTATTTACC 
GTTTCCGGTG TTATTGCCGC ATTTCGTCGC AGCGCCCTGG CAGAAGTGGG TTACTGGAGT 
GACGATATGA TCACCGAAGA TATTGATATT AGCTGGAAGC TGCAGTTGAA TCAGTGGACG 
ATTTTTTACG AGCCACGGGC ACTGTGCTGG ATATTAATGC CTGAAACGTT AAAAGGGCTG 
TGGAAACAGC GCCTGCGCTG GGCTCAGGGC GGTGCAGAAG TATTCCTCAA AAATATGACA 
AGGTTGTGGC GCAAAGAAAA CTTTCGAATG TGGCCGCTGT TTTTTGAATA CAGCCTGACG 
ACAATATGGG CCTTCACCTG CCTGGTCGGT TTCATTATTT ACGCAGTCCA ACTTGCCGGT 
GTACCGTTAA ATATTGAATT GACACATATC GCTGCGACAC ATACTGCCGG AATATTATTG 
TGTACGTTAT GTTTACTGCA ATTTATTGTC AGCCTGATGA TCGAGAATCG CTATGAGCAT 
AATCTGACTT CATCGCTTTT CTGGATTATT TGGTTCCCGG TTATTTTCTG GATGCTGAGC 
CTGGCAACGA CATTGGTATC ATTTACACGA GTCATGTTGA TGCCTAAAAA GCAACGCGCC 
CGTTGGGTAA GTCCCGATCG CGGGATTCTG AGAGGTTAA

Protein sequence

MMRFVFFWPF FMSIMWIVGG VYFWVYRERR WPWGENAPAP QLKDNPSISI IIPCFNEEKN 
VEETIHAALA QRYENIEVIA VNDGSTDKTR AILDRMAAQI PHLRVIHLAQ NQGKAIALKT 
GAAAAKSEYL VCIDGDALLD RDAAAYIVEP MLYNPRVGAV TGNPRIRTRS TLVGKIQVGE 
YSSIIGLIKR TQRIYGNVFT VSGVIAAFRR SALAEVGYWS DDMITEDIDI SWKLQLNQWT 
IFYEPRALCW ILMPETLKGL WKQRLRWAQG GAEVFLKNMT RLWRKENFRM WPLFFEYSLT 
TIWAFTCLVG FIIYAVQLAG VPLNIELTHI AATHTAGILL CTLCLLQFIV SLMIENRYEH 
NLTSSLFWII WFPVIFWMLS LATTLVSFTR VMLMPKKQRA RWVSPDRGIL RG