Gene EcolC_3180 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3180
Symbol
ID	6066582
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	3486071
End bp	3487183
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	49%
IMG OID	641602596
Product	glycosyl transferase group 1
Protein accession	YP_001726130
Protein GI	170021176
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACAAA AAATCACGGT TCTCGGTACA CGCGGGATAC CGGATGTCCA GGGTGGTGTG 
GAAACACACT GCCAGAATCT TTACCCGGCT ATAAAAAAGC AGTTTGATAT GGATATCTGC 
GTTATCGCTC GCTCTCCCTA CGTCAGCTAT AAACAGACGT ATTATAAAAA TGTTGAAACA 
TACTCTCTAT GGGCTCCGAA GAAGCGATCG CTGGAAGCGA TTGTCCATTC CTTCTTAGCC 
ACGTTAAGAA CCTGTTTCGA TGGTTCTGAT ATTGTGCACG TTCATGCCAT CGGACCCGGA 
CTTCTGGTGC CACTGCTGCG TGTGCTAGGA AAGAAGGTGG TGTTTACCCA CCATGGTCCA 
GATTACGATC GCCAGAAATG GGGGCGTCTG GCTAAAAGGG TGCTGCAACT GGGAGAGAAA 
GTGGCTGTTA AGTATGCCAA TGAAGTGATC GTTATTTCAG AGGTGATTAA TCAACTGATA 
CGCACAAAAC ACTGTCGTGA TGATGCACAC TTGATCTACA ACGGCGTCAA TTTACCGTTG 
CCGTTAAAGG AAGAGACTGT GCGCACGGTG TTGGGACGTT ACGCGCTGCA GCCGCAAAAT 
TACCTGGTTG TCGTTGGGCG GTTTGTGGAA GAAAAAGGTA TGCATGATGC GATTGCTGCC 
CACCGCAAAC TGGGGCTCAC GATGCCGCTG GTATTGGTGG GTGATGCCGA TCATCCCACG 
GAATATAGCG TCCGCCTTAA AAAGATGGCT GCAGATACGC CGAACGTCAT CATGACGGGG 
TTCCTCAAAG GTGAGGAATT GCAGGCTATC TTTTCTCAGG CGCGGCTGTT TTTGATGCCT 
TCATACCATG AAGGGTTACC GATAGCGCTT CTCGAAGCGA TGGCCTATTC ACTGCCCGCC 
GTGGTCAGTG ATATTCCTGC GAATCTTGAA GTAAAATTGC CGCCAGAATC GTATTTCGAG 
GTCGGCAACG TCGACGCTCT GGCGCAAAAA ATAGCAGCGT TGGTTTCCTC ACAGCGGATT 
GACTACAGCG CCTGGCTGAA AAATTACGAC TGGCAGGTGA TCGCGAGAAA AACCGCCAGT 
GTCTACCATT CCTTAGCAAA TAAAAAAGGT TAA

Protein sequence

MSQKITVLGT RGIPDVQGGV ETHCQNLYPA IKKQFDMDIC VIARSPYVSY KQTYYKNVET 
YSLWAPKKRS LEAIVHSFLA TLRTCFDGSD IVHVHAIGPG LLVPLLRVLG KKVVFTHHGP 
DYDRQKWGRL AKRVLQLGEK VAVKYANEVI VISEVINQLI RTKHCRDDAH LIYNGVNLPL 
PLKEETVRTV LGRYALQPQN YLVVVGRFVE EKGMHDAIAA HRKLGLTMPL VLVGDADHPT 
EYSVRLKKMA ADTPNVIMTG FLKGEELQAI FSQARLFLMP SYHEGLPIAL LEAMAYSLPA 
VVSDIPANLE VKLPPESYFE VGNVDALAQK IAALVSSQRI DYSAWLKNYD WQVIARKTAS 
VYHSLANKKG