Gene EcolC_1584 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1584
Symbol
ID	6066497
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1761146
End bp	1762363
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	54%
IMG OID	641601000
Product	putative glycosyl transferase
Protein accession	YP_001724570
Protein GI	170019616
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATATTC TGCAATTTAA TGTGCGACTG GCGGAAGGCG GGGCAGCAGG TGTGGCGTTA 
GATCTCCACC AGCGTGCGCT GCAACAGGGG CTGGCGTCAC ATTTTGTCTA CGGCTACGGC 
AAAGGCGGCA AAGAGAGCGT CAGCCATCAA AACTATCCGC AGGTCATCAA ACATACGCCG 
CGGATGACCG CGATGGCGAA CATTGCCCTG TTTCGTCTCT TTAATCGCGA TCTGTTTGGC 
AATTTCAATG AGTTATATCG CACCATTACT CGCACACCGG GTCCGGTGGT CCTGCATTTT 
CATGTGCTGC ACAGCTACTG GCTAAATCTT AAGAGCGTGG TGCGCTTTTG CGAAAAGGTG 
AAAAACCATA AAACGGACGT CACTCTGGTC TGGACGCTGC ACGACCACTG GAGCGTTACC 
GGACGCTGCG CCTTTACCGA CGGTTGCGAA GGCTGGAAAA CGGGCTGCCA GAAATGCCCG 
ACCTTAAATA ATTATCCGCC GGTGAAGATT GATCGCGCAC ACCAACTGGT GGCGGGCAAA 
CGCCAGTTAT TCCGTGAGAT GCTGGCGCTG GGCTGTCAGT TTATTTCCCC CAGCCAGCAT 
GTGGCTGACG CTTTCAATAG CCTGTACGGT CCAGGGCGTT GCCGGATTAT CAATAACGGT 
ATTGATATGG CAACCGAAGC GATTCTGGCG GATCTGCCTC CGGTGCGCGA AACCCAGGGT 
AAGCCGAAAA TCGCGGTGGT GGCGCATGAC CTGCGTTACG ACGGCAAAAC TAACCAGCAA 
CTGGTGCGTG AGATGATGGC GCTGGGCGAC AAAATCGAAC TGCATACCTT TGGTAAGTTC 
TCGCCGTTCA CCGCTGGTAA CGTGGTTAAT CACGGCTTTG AAACCGACAA ACGTAAGCTG 
ATGAGCGCGC TCAATCAGAT GGATGCGCTG GTATTCAGTT CTCGCGTCGA TAACTACCCG 
CTGATTTTGT GTGAGGCGCT ATCGATTGGT GTGCCGGTGA TTGCCACCCA TAGCGATGCG 
GCGCGGGAAG TGCTGCAAAA ATCCGGCGGT AAAACTGTCA GCGAAGAAGA GGTGCTGCAA 
CTGGTGCAGT TAAGCAAACC GGAAATCGCG CATGCGATAT TTGGTACCAC GCTGGCTGAG 
TTCAGCCAAC GCAGCCGCGC CGCCTACAGT GGACAACAGA TGCTGGAGGA GTATGTCAAC 
TTCTATCAGA ATCTGTAG

Protein sequence

MNILQFNVRL AEGGAAGVAL DLHQRALQQG LASHFVYGYG KGGKESVSHQ NYPQVIKHTP 
RMTAMANIAL FRLFNRDLFG NFNELYRTIT RTPGPVVLHF HVLHSYWLNL KSVVRFCEKV 
KNHKTDVTLV WTLHDHWSVT GRCAFTDGCE GWKTGCQKCP TLNNYPPVKI DRAHQLVAGK 
RQLFREMLAL GCQFISPSQH VADAFNSLYG PGRCRIINNG IDMATEAILA DLPPVRETQG 
KPKIAVVAHD LRYDGKTNQQ LVREMMALGD KIELHTFGKF SPFTAGNVVN HGFETDKRKL 
MSALNQMDAL VFSSRVDNYP LILCEALSIG VPVIATHSDA AREVLQKSGG KTVSEEEVLQ 
LVQLSKPEIA HAIFGTTLAE FSQRSRAAYS GQQMLEEYVN FYQNL