Gene EcolC_1608 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1608
Symbol
ID	6067678
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1788690
End bp	1789832
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	29%
IMG OID	641601024
Product	glycosyl transferase group 1
Protein accession	YP_001724594
Protein GI	170019640
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.372835
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.872915
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTAAAG TTTTAATAGT GTTCCATGAC GGTGATAAAA AAAGTGGTGC AACAGCCTCA 
ATGTTAGATC TTTTAACAGA GCTGATCAAA TGTAAAGATT TGAAAATAAT ATGCTTAATT 
CCAAAGTATG GGTCTTTATA TGATGAACTA AAAAGATTAA GAATTAAAAC TTATGTTATT 
AAATATTATA GTGGGAGATA TAGTCTTGGG AGTTATAAAG GTACTGTTTG GAATATCATA 
AAAACCTTAA TAAAACAGTT AATTACCTTT TTATCTTTTA TGAAAGTTAA AAATAAATTT 
ATGAATATCG ATGTCGTTTA TACGAATACA TCTGATAACT ATATGGGATT GTTACTCTCA 
ATTTTTCTTA AAAAAAAGAA TATTTTTCAT ATTAGGGAAT TCGGTTTAGA AGATCAACAC 
CAAAAGCATA TAATTACAGA TCATTTATAT TACTCGTTGG TAAACAAATA TGCTAATGAA 
GTTATAGTTA TATCAGAAGC GTTAAAAAAT AAAATAATAA AATACATTAC AGGAAATAAT 
CTTAATCTAA TATATGATGA TGTCCATATC CAAAACAAAC CAATGCTAAA TTATGCTAAT 
TCGGCTAGGC TGCGGAAGTT CATTATTATT GGCACATTAT GTGAGGGGAA AGGTCAAAAA 
ATAGCCATAG AGGCTATGCA TAATCTGATT CGTGAAGGAT ATTTATGTCA CTTAAAAATA 
ATTGGAAATA ATAGAGTTCC ATATGCAAGT TATCTTAATA AAATTGTTGC TGATTATAAT 
TTGAGTGATT ATGTAGAGTT TATGGGATTT AGGCATGATC TTGATCAAAT AAGGCTTGAC 
AACGATGTTT GCTTAATTCC CTCTCTTTCT GAAGCTTTTG GTAGAGTTAC CATTGAATCA 
ATGGCTGCAG GTATGATAGT TGTTGCTAGT GATTCTGGTG CTAGTAAAGA GATCATCAAT 
GATGGTATAA ACGGTTTTTT GTTTTCTTCA GGTTCGGTAA GTGATCTTAC TAGCGTACTT 
AAAAAAATCC TTGATGTAGA GTCTAATAAT TTAGAATGTA TAAGGAAAAG GGCTTTGGTT 
GACTCACAAA AATATACATC AGGACATGCA GCTTCATCAA TTTATAATTT GATCATTAAC 
TGA

Protein sequence

MTKVLIVFHD GDKKSGATAS MLDLLTELIK CKDLKIICLI PKYGSLYDEL KRLRIKTYVI 
KYYSGRYSLG SYKGTVWNII KTLIKQLITF LSFMKVKNKF MNIDVVYTNT SDNYMGLLLS 
IFLKKKNIFH IREFGLEDQH QKHIITDHLY YSLVNKYANE VIVISEALKN KIIKYITGNN 
LNLIYDDVHI QNKPMLNYAN SARLRKFIII GTLCEGKGQK IAIEAMHNLI REGYLCHLKI 
IGNNRVPYAS YLNKIVADYN LSDYVEFMGF RHDLDQIRLD NDVCLIPSLS EAFGRVTIES 
MAAGMIVVAS DSGASKEIIN DGINGFLFSS GSVSDLTSVL KKILDVESNN LECIRKRALV 
DSQKYTSGHA ASSIYNLIIN