Gene EcolC_0082 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0082
Symbol
ID	6068385
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	86633
End bp	87649
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	38%
IMG OID	641599486
Product	lipopolysaccharide 3-alpha-galactosyltransferase
Protein accession	YP_001723095
Protein GI	170018141
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1442] Lipopolysaccharide biosynthesis proteins, LPS:glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.313803
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00265615
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGTGCCC ACTATTTTAA TCCACAAGAG ATGATCACTA AGACAATCAT CTTCGATGAA 
AGGCCAGCGG CGTCAGTGGC ATCATCATTC CATGTTGCTT ATGGCATTGA TAAAAACTTT 
CTTTTTGGTT GTGGTGTTTC AATCACGTCA GTTTTGTTTC ATAACAACGA CGTGAGTTTT 
GTTTTCCACG TTTTTATTGA TGATATCCCT GAAGCCGATA TCCAGCGTTT AGCCCAATTG 
GCGAAAAGCT ATCGTACCTG TATCCAGATC CATCTGGTAA ATTGTGAACG GCTTAAGGCA 
TTACCGACGA CCAAAAATTG GTCTATTGCC ATGTATTTCC GTTTTGTAAT TGCAGATTAC 
TTTATTGATC AACAAGATAA GGTTCTTTAC CTGGATGCTG ATATCGCCTG TCAGGGAAAC 
TTAAAGCCGC TGATAACAAT GGATCTTGCC AATAACATTG CTGCTGTTGT TACTGAACGC 
GATGCTAACT GGTGGTCGTT ACGGGGTCAA AGTCTGCAGT GTAATGAACT TGAAAAGGGT 
TACTTTAATT CAGGTGTCCT GTTAATTAAT ACACTAGCGT GGGCGCAGGA GTCCGTTTCT 
GCTAAAGCGA TGTCGATGCT TGCTGATAAA GCCGTCGTTT CCCGTTTAAC CTATATGGAT 
CAAGATATAC TTAATCTTAT CCTGTCAGGG AAAGTTAAAT TCATTGATGC TAAATACAAT 
ACGCAATTTA GTTTAAATTA TGAATTAAAA AAATCATTTG TTTGTCCAAT TAATGATGAA 
ACCGTATTAA TTCATTATGT CGGCCCGACA AAACCCTGGC ATTACTGGGC CGGTTATCCA 
AGTGCGCGAC CTTTTATCAA AGCCAAAGAG GCATCGCCCT GGAAAAATGA ACCGTTAATG 
CGGCCAGTTA ACTCAAACTA TGCTCGTTAT TGCGCCAAGC ATAATTTTAA ACAAAATAAA 
CCAATTAACG GGATAATGAA TTATATTTAT TATTTTTATT TAAAGATAAT AAAATGA

Protein sequence

MSAHYFNPQE MITKTIIFDE RPAASVASSF HVAYGIDKNF LFGCGVSITS VLFHNNDVSF 
VFHVFIDDIP EADIQRLAQL AKSYRTCIQI HLVNCERLKA LPTTKNWSIA MYFRFVIADY 
FIDQQDKVLY LDADIACQGN LKPLITMDLA NNIAAVVTER DANWWSLRGQ SLQCNELEKG 
YFNSGVLLIN TLAWAQESVS AKAMSMLADK AVVSRLTYMD QDILNLILSG KVKFIDAKYN 
TQFSLNYELK KSFVCPINDE TVLIHYVGPT KPWHYWAGYP SARPFIKAKE ASPWKNEPLM 
RPVNSNYARY CAKHNFKQNK PINGIMNYIY YFYLKIIK