Gene EcolC_0085 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0085
Symbol
ID	6068369
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	89389
End bp	90414
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	37%
IMG OID	641599489
Product	lipopolysaccharide glucosyltransferase I
Protein accession	YP_001723098
Protein GI	170018144
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1442] Lipopolysaccharide biosynthesis proteins, LPS:glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.416805
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0154654
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTTAT TAGCTGAGAG TATTACTGAA GTCGCTGTCT CTGGGGAAAT TGCTAACACC 
GATCGTGTGT TAAATATCGC TTACGGTATT GACCGTAACT TTTTATTTGG TGCGGCAGTA 
TCTATGCAAT CAGTTGTTAT GCATAACCCG GACCTTGCGG TTAAGTTTCA TCTCTTTACC 
GACTACATTG ATGAAGATTA TCTACAACGT GTTAATGCTT TTACCAGCAA AAATGCTAAC 
GTTGAAGTAA GAATTTATAA AGTCTCCAAT GCCTTTATTG ATATCTTCCC CAGCCTGAAA 
CAGTGGTCTT ATGCAACATT CTTCCGTTTA GTTGCGTTCC AGTATCTGAG TGAAACTATT 
GAAAATCTGT TATATATCGA TGCTGATGTC ATCTGTAAAG GCTCATTAGC TGGATTGCTT 
GATATTAATT TTGATGGGGA TAAGTTTGCA GCTGTTATTA AAGATGTGCC TTTTATGCAG 
GAAAAACCAG CGAAGCGTCT GGCTATAGAG GGACTTCCAG GGAATTATTT CAACGCCGGT 
GTAGTATATC TGCAGCTTGA AGCATGGGCG AAAAATGATT TTATGAATAA AGCCATTGCT 
ATGCTGGCAA GTGACCCGCA GCACACGAAG TATAAATGCC TTGATCAGGA TATTTTAAAT 
ATTCTGTTTT TTGGTCATTG TATTTTTATT AGCGGCGATT ATGATTGCTT TTATGGCATC 
GATTATGAGT TAAAAAATAA AAGCGATGAA GATTATAAAA AGACCATTAC CGATGATACT 
AAGCTGATTC ATTATGTTGG CGTAACGAAG CCCTGGAACG ACTGGACGAA TTATCCCTGC 
CAGAACTATT TTAATGAGGC TTATCAGGCT TCTTGCTGGA ATGATGTGGC GTTTATTCCA 
GCCACGAATG AAAAGCAGTA TCAAGTGAAA TATCAACATG CAAAGAAAAA TGGTGATACG 
TTTAACGCTT TTATTTACTT CATTAAATTT AAATTAAATA AGTATAAAAG AAAACTATTT 
GGGTAA

Protein sequence

MDLLAESITE VAVSGEIANT DRVLNIAYGI DRNFLFGAAV SMQSVVMHNP DLAVKFHLFT 
DYIDEDYLQR VNAFTSKNAN VEVRIYKVSN AFIDIFPSLK QWSYATFFRL VAFQYLSETI 
ENLLYIDADV ICKGSLAGLL DINFDGDKFA AVIKDVPFMQ EKPAKRLAIE GLPGNYFNAG 
VVYLQLEAWA KNDFMNKAIA MLASDPQHTK YKCLDQDILN ILFFGHCIFI SGDYDCFYGI 
DYELKNKSDE DYKKTITDDT KLIHYVGVTK PWNDWTNYPC QNYFNEAYQA SCWNDVAFIP 
ATNEKQYQVK YQHAKKNGDT FNAFIYFIKF KLNKYKRKLF G