Gene EcolC_2574 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2574
Symbol
ID	6065010
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2821972
End bp	2823210
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	47%
IMG OID	641601981
Product	N-glycosyltransferase
Protein accession	YP_001725532
Protein GI	170020578
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0472996
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAGGT TCGTTTTCTT CTGGCCGTTT TTTATGTCCA TTATGTGGAT TGTTGGCGGC 
GTCTATTTCT GGGTCTATCG TGAACGCCAC TGGCCGTGGG GAGAAAACGC ACCAGCTCCC 
CAGTTGAAAG ATAATCCGTC TATCTCCATT ATCATTCCCT GTTTTAATGA GGAGAAAAAC 
GTTGAGGAAA CCATACACGC CGCTTTAGCA CAGCGTTATG AGAACATTGA AGTTATTGCC 
GTAAATGACG GTTCAACAGA TAAAACCCGT GCCATCCTGG ATCGCATGGC TGCACAAATT 
CCCCATTTGC GGGTCATTCA TCTGGCGCAA AACCAGGGGA AAGCCATTGC GCTTAAAACC 
GGAGCTGCCG CGGCGAAAAG TGAATATCTG GTGTGCATTG ATGGCGATGC GTTATTAGAC 
CGCGATGCGG CGGCATATAT TGTGGAACCG ATGTTGTACA ACCCGCGTGT GGGTGCCGTA 
ACCGGTAATC CTCGTATTCG AACACGTTCT ACCCTGGTGG GTAAAATTCA GGTTGGCGAG 
TATTCCTCAA TTATTGGTTT GATCAAGCGA ACCCAGCGTA TCTATGGAAA CGTATTTACC 
GTTTCCGGTG TTATTGCCGC ATTTCGTCGC AGCGCCCTGG CAGAAGTGGG TTACTGGAGT 
GACGATATGA TCACCGAAGA TATTGATATT AGCTGGAAGC TGCAGTTGAA TCAGTGGACG 
ATTTTTTACG AGCCACGGGC ACTGTGCTGG ATATTAATGC CTGAAACGTT AAAAGGGCTG 
TGGAAACAGC GCCTGCGCTG GGCTCAGGGC GGTGCAGAAG TATTCCTCAA AAATATGACA 
AGGTTGTGGC GCAAAGAAAA CTTTCGAATG TGGCCGCTGT TTTTTGAATA CTGCCTGACG 
ACAATATGGG CCTTCACCTG CCTGGTCGGT TTCATTATTT ACGCAGTCCA ACTTGCCGGT 
GTACCGTTAA ATATTGAATT GACACATATC GCTGCGACAC ATACTGCCGG AATATTATTG 
TGTACGTTAT GTTTACTGCA ATTTATTGTC AGCCTGATGA TCGAGAATCG CTATGAGCAT 
AATCTGACTT CATCGCTTTT CTGGATTATT TGGTTCCCGG TTATTTTCTG GATGCTGAGC 
CTGGCAACGA CATTGGTATC ATTTACACGA GTCATGTTGA TGCCTAAAAA GCAACGCGCC 
CGTTGGGTAA GTCCCGATCG CGGGATTCTG AGAGGTTAA

Protein sequence

MMRFVFFWPF FMSIMWIVGG VYFWVYRERH WPWGENAPAP QLKDNPSISI IIPCFNEEKN 
VEETIHAALA QRYENIEVIA VNDGSTDKTR AILDRMAAQI PHLRVIHLAQ NQGKAIALKT 
GAAAAKSEYL VCIDGDALLD RDAAAYIVEP MLYNPRVGAV TGNPRIRTRS TLVGKIQVGE 
YSSIIGLIKR TQRIYGNVFT VSGVIAAFRR SALAEVGYWS DDMITEDIDI SWKLQLNQWT 
IFYEPRALCW ILMPETLKGL WKQRLRWAQG GAEVFLKNMT RLWRKENFRM WPLFFEYCLT 
TIWAFTCLVG FIIYAVQLAG VPLNIELTHI AATHTAGILL CTLCLLQFIV SLMIENRYEH 
NLTSSLFWII WFPVIFWMLS LATTLVSFTR VMLMPKKQRA RWVSPDRGIL RG