Gene ECH74115_4995 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4995
Symbol
ID	6971098
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	4646905
End bp	4648113
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	35%
IMG OID	643388676
Product	lipid A-core:surface polymer ligase
Protein accession	YP_002273103
Protein GI	209399220
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3307] Lipid A core - O-antigen ligase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.150422
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	71
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTCAA CATTATTTTT CTCTCTCGAG AAAAAAAACT GGATAGCGTA CTGGAACAGA 
GCTCTCGTAT TCTTATTCAT TACCACCTAT TTTTTGGGTG GGATTACAAG GTATAAACAT 
CTTATTGTTA TTCTTATGAC AATAACGACA ATCGTCTATC TCTGCAAACG GCCAAAACAC 
TATCTCTCAC TATTTAAAAC ATTTCTTTTT GGTAGTGTTG CCATATTAAC TATTGCTGCA 
TTGCTGTCAC TTCTTCAATC CCCTGATGCA GGTGCTAGCA TGAAGGAAAT TTTCAAAGCT 
ATTATTGAGA ATACTTTACT ATGCACAATA GCAATACCGA TCATATTGAG AGACGAGAAA 
AGAGAAGATG TCGAAAAAAT CGTTTTCTTC TCATTTATTA GTGCGTTGGG CTTACGCTGT 
TTTTCTGAAT TGATTACCTA TTATAAGGAC TATCAACAAG GGATAATGCC ATTCGCAGAT 
TATAGACACC GTAGCATTTC TGACTCGATG GTCTTTTTAT TCCCTGCATT GTTAAATCTC 
TGGCTTATCA AATCAGCAAA ATACCGCATT TCTTTTGTGG TTCTAAGCGT TATTTTTATT 
TTTCTGATAT TAGGAACTTT ATCCAGAGGG GCCTGGCTTT CCGTGTTAGT CATTGGATTA 
ATATGGATTC TGATGTTTAA ACAATGGAAG TTACTATTAG TAGGAGTAAT GGTTGCCATC 
ATTGCATTGT CGGTTATTTT CACACATAAG GAGATGACCG CAAAGCTAAC GTATAAACTT 
CAACAAACTA ATAGTTCTTA TCGCTATGCA AATGGTACTC AAGGCAGCGC ACTCGATCTA 
ATATTAGAAA ATCCTGTTAT TGGTTATGGT TACGGTAACG TTGCATATAA AGATGTCTAT 
AATAAACGTG TCATTGATTA TCCAGAATGG ACCTTTAGAC AATCAATAGG GCCACATAAT 
TTTGCGCTAT TCATCTGGTT TGGCACTGGT TTATTAGGGC TGGTAAGTCT TATGATGCTA 
TACTGTGCAA TATTGAAAGA GTGTATAAAA AATGGCGTCA AGAATAAATA TCGCTCACCA 
TATAATGCAT ATTATATAAT CTTACTATCT TTTATAGGTT ATTTTGTTAT CCGTGGAAAC 
GTAGAACAAA TTGAACCAAA TTTATTAGGC GTTTACGCCG GCTTATTATT AGCGATGAAA 
AACAAGTAA

Protein sequence

MTSTLFFSLE KKNWIAYWNR ALVFLFITTY FLGGITRYKH LIVILMTITT IVYLCKRPKH 
YLSLFKTFLF GSVAILTIAA LLSLLQSPDA GASMKEIFKA IIENTLLCTI AIPIILRDEK 
REDVEKIVFF SFISALGLRC FSELITYYKD YQQGIMPFAD YRHRSISDSM VFLFPALLNL 
WLIKSAKYRI SFVVLSVIFI FLILGTLSRG AWLSVLVIGL IWILMFKQWK LLLVGVMVAI 
IALSVIFTHK EMTAKLTYKL QQTNSSYRYA NGTQGSALDL ILENPVIGYG YGNVAYKDVY 
NKRVIDYPEW TFRQSIGPHN FALFIWFGTG LLGLVSLMML YCAILKECIK NGVKNKYRSP 
YNAYYIILLS FIGYFVIRGN VEQIEPNLLG VYAGLLLAMK NK