Gene EcolC_0089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0089
Symbol
ID	6068622
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	93826
End bp	94872
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	54%
IMG OID	641599493
Product	ADP-heptose:LPS heptosyltransferase II
Protein accession	YP_001723102
Protein GI	170018148
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID	[TIGR02195] lipopolysaccharide heptosyltransferase II

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000834595
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.156713
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATAC TGGTGATCGG CCCGTCTTGG GTTGGCGACA TGATGATGTC GCAAAGTCTC 
TATCGCACGC TCCAGGCGCG CTATCCCCAG GCGATAATCG ATGTGATGGC ACCGGCATGG 
TGCCGTCCAT TATTATCGCG GATGCCGGAA GTTAACGAAG CTATCCCTAT GCCTCTCGGT 
CACGGAGCGC TGGAAATCGG CGAACGCCGC AAACTGGGTC ATAGCCTGCG TGAAAAGCGC 
TACGACCGCG CCTACGTCTT ACCAAACTCC TTCAAATCTG CATTAGTGCC TTTCTTCGCG 
GGTATTCCTC ATCGCACTGG CTGGCGCGGC GAGATGCGCT ACGGTTTACT CAACGATGTA 
CGCGTGCTCG ATAAAGAAGC CTGGCCGCTA ATGGTGGAAC GCTATGTCGC GCTGGCCTAT 
GACAAAGGCA TTATGCGTAC CGCACAAGAT CTGCCGCAGC CATTGTTATG GCCGCAGTTG 
CAGGTGAGCG AAGGTGAAAA ATCATATACC TGTAATCAAT TTTCGCTTTC ATCAGAACGT 
CCGATGATTG GCTTTTGCCC GGGTGCGGAG TTTGGTCCGG CAAAACGCTG GCCACACTAC 
CACTATGCGG AGCTGGCAAA GCAGCTGATT GATGAAGGTT ATCAGGTGGT TCTGTTTGGC 
TCTGCGAAAG ATCATGAAGC GGGCAATGAG ATTCTTGCCG CTTTGAATAC CGAGCAGCAG 
GCATGGTGTC GGAACCTGGC GGGGGAAACA CAGCTTGATC AAGCGGTTAT CCTGATTGCA 
GCCTGTAAAG CCATTGTCAC TAACGATTCT GGCCTAATGC ACGTTGCGGC GGCGCTCAAT 
CGTCCGCTGG TTGCCCTGTA TGGTCCGAGT AGCCCGGACT TCACACCGCC GCTATCCCAT 
AAAGCGCGCG TGATCCGTCT GATTACCGGC TATCACAAAG TGCGTAAAGG TGACGCTGCG 
GAGGGTTATC ACCAGAGCTT GATCGACATT ACTCCCCAGC GCGTACTGGA AGAACTCAAC 
GCGCTATTGT TACAAGAGGA AGCCTGA

Protein sequence

MKILVIGPSW VGDMMMSQSL YRTLQARYPQ AIIDVMAPAW CRPLLSRMPE VNEAIPMPLG 
HGALEIGERR KLGHSLREKR YDRAYVLPNS FKSALVPFFA GIPHRTGWRG EMRYGLLNDV 
RVLDKEAWPL MVERYVALAY DKGIMRTAQD LPQPLLWPQL QVSEGEKSYT CNQFSLSSER 
PMIGFCPGAE FGPAKRWPHY HYAELAKQLI DEGYQVVLFG SAKDHEAGNE ILAALNTEQQ 
AWCRNLAGET QLDQAVILIA ACKAIVTNDS GLMHVAAALN RPLVALYGPS SPDFTPPLSH 
KARVIRLITG YHKVRKGDAA EGYHQSLIDI TPQRVLEELN ALLLQEEA