Gene EcolC_3172 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3172
Symbol
ID	6066564
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	3475881
End bp	3477305
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	41%
IMG OID	641602588
Product	undecaprenyl-phosphate glucose phosphotransferase
Protein accession	YP_001726122
Protein GI	170021168
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2148] Sugar transferases involved in lipopolysaccharide synthesis
TIGRFAM ID	[TIGR03023] Undecaprenyl-phosphate glucose phosphotransferase [TIGR03025] exopolysaccharide biosynthesis polyprenyl glycosylphosphotransferase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.247578
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTTAATA TGTCGACATG TTCATTAAAA TTCAATAGTG AAGAATGTTC TGCATTCATC 
AAGGTGCTTG ATTTCACTGT AATCAATGCA ACATTGATTA CAAGCGCCTG GTTCTTTGAA 
ACGAAGTATT TTGGTACGGC AGTATTATTT TGTCTGCTCT TCTCTACTCT CTTTTTGTTA 
TTTTCAGAAT ACACAAAGGT ATACCAACGG AAAATCAGGA AATTTCGTTT TCGTGATTTT 
AAAGGGATTC TCGGCAGTGC ATTACTGGCT ATACTTCTTT GTGAAGTAAT CAGGTATACT 
CTTGCACAAG TATATCCTCA GGGGGATTTT AACTCGCTGG GTGATGATTT TGTTTCCCCT 
ATTGTCGTAT GGTATCTATT ACCGTTTCCT GCTCTTTTGT GTATTCGCTA TTTACTTCTT 
AAGTATACGT CCAGAAAAAG CACCCGGGTG GCAATTGTTG GTGTTACCGA AAACGGCCTG 
GCAGTTGAAG AGGCATTGCG AAACGAATAC TCAAACATGC AGCTGGACCT TGCTTTTTAT 
GATGAGCGGG ATTTTTCGCG GCTCGATGAT GTAGCAAAGA AGATTAAAAG CCCATTTAAG 
GGTTCGGTAC AGACACTGGT CGAAGAGGCC AGACGAGGGA ATGTTGATGA AATTTATATC 
GCTCTGCCGA TGGTTGCTTT GCAGCGTATC CGTCATTTTC TGTCGATGAT GTCAGATACT 
ACGGTGGATA CCTATATTGT TCCTGACTTT TATACTTACA GTAACAATAT GTCCAAATTT 
CGCAATATCC ATGATCTGCA TACCATTGCT ATTTTCAGTT CGCCGTTCGA AGGAGTGAGT 
TCATTTATCA AGCGTGCGGA AGATCTGATT GTGGGCAGCA TTATCATGGT TATGATTTCC 
TTATTAATGC TGATTATTGC GATTGGCATC AAACTGACTT CTCGTGGACC TGTATTTTTT 
AAACAGGATC GGTACGGGCT AAGCGGACAA AAGATTAAAG TGTGGAAATT CCGCACCATG 
AAGGTCATGG AAAACGATGA TGTCGTGAAA CAAGCCACGA AGAACGATCC TCGGGTGACA 
CCCTTCGGGG CCTTTTTACG CCGCACTTCT CTCGATGAGC TGCCGCAATT TATCAACGTC 
ATTCAGGGAA GTATGTCAAT TGTTGGCCCC CGACCCCATG CGGTTGCACA TAACGAGCTG 
TACCGTAAGC AGGTTGAGAA CTACATGATA CGTCATAAGG TAAAACCGGG GATCACTGGT 
CTTGCGCAGG TCAACGGCTT CCGTGGGGAA ATTGATACGC TCTATAAAAT GGAAAAAAGA 
GTTCAGTACG ACATTGAATA CATCAAGAAA TGGTCTTTAT GGCTGGATAT AAAAATTATT 
ATTAAAACAA TTTTTAAAGG GTTTGTCGGA AAGAATGCGT ATTAA

Protein sequence

MFNMSTCSLK FNSEECSAFI KVLDFTVINA TLITSAWFFE TKYFGTAVLF CLLFSTLFLL 
FSEYTKVYQR KIRKFRFRDF KGILGSALLA ILLCEVIRYT LAQVYPQGDF NSLGDDFVSP 
IVVWYLLPFP ALLCIRYLLL KYTSRKSTRV AIVGVTENGL AVEEALRNEY SNMQLDLAFY 
DERDFSRLDD VAKKIKSPFK GSVQTLVEEA RRGNVDEIYI ALPMVALQRI RHFLSMMSDT 
TVDTYIVPDF YTYSNNMSKF RNIHDLHTIA IFSSPFEGVS SFIKRAEDLI VGSIIMVMIS 
LLMLIIAIGI KLTSRGPVFF KQDRYGLSGQ KIKVWKFRTM KVMENDDVVK QATKNDPRVT 
PFGAFLRRTS LDELPQFINV IQGSMSIVGP RPHAVAHNEL YRKQVENYMI RHKVKPGITG 
LAQVNGFRGE IDTLYKMEKR VQYDIEYIKK WSLWLDIKII IKTIFKGFVG KNAY