Gene EcSMS35_1145 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1145
Symbol
ID	6144672
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1163638
End bp	1164690
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	39%
IMG OID	641616023
Product	hypothetical protein
Protein accession	YP_001743212
Protein GI	170681197
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0327893
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0000000362353
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTTTTAG CATCATTGTT GAGACGTATT GCATTTAGTT ACTACGATTA TAAAGCTTAT 
AATTTCAATA TTGAAAAAAC AGACTTTGTT GTCATCCATA TTCCCGACCA GATTGGCGAT 
GCTATGGCCA TCTTTCCTGT TATTCGGGCG CTTGAATTGC ATAAAATTAA GCATCTTTTA 
ATTGTTACGT CGACAATTAA TTTAGAAGTG TTTAATGCAC TTAAACTTGA AAAGACTAAA 
TTAACATTAG TCACAATGAC TATGCAGGAT CACGCAACAT TAAAAGAAAT AAAAGATTTA 
GCAAAGAACA TAACACAGAA ATACGGTACG CCGGATCTTT GTATAGAGGC GATGCGTAAA 
AAGAACCTGA AAACGATGAT ATTTATCAGT CAGTTGAAAG CAAAAACGAA TTTTCAGGTT 
GTTGGTTTAA CCATGAAGTG CTACTCCCCT TTGTGCAAGA ACGCGTCCCG GATGGATCAG 
AATCTCCGGG CTCCTGTACC CATGACATGG GCATTTATGA TGCGTGAGGC GGGTTTTCCA 
GCAGTCAGGC CAATATATGA ATTGCCACTA AGTGAGGATG TACTCGATGA GGTGCGCGAG 
GAAATGCGAT CGTTAGGATC TTACATTGCG CTTAATTTAG AAGGTAGCTC GCAGGAACGT 
ACATTTTCAT TATCGATTGC AGAAAATCTA ATAGCAAAAA TTCAAAGTGA AACAGATATA 
CCAATAGTGA TCGTTCATGG ACCAAAAGGG GAAGATAAAG CCAGGGTATT AGTGGATTGT 
TATAATAATG TCTACCGTTT ATCCTTATCA CCCTCGATTA AACGTTCAGC AGCAATCATA 
AAAGATGCTT ATATCGCAAT AACTCCTGAC ACCTCAATAT TACATATGGC AAGTGCCTAT 
AATACTCCCG TTGTTGCAAT TTATGCTGAT TACAAAACGC GATGGCCCGC AATGGCCGAT 
GTTTCGGAGT CAGTCGTCGT TGGGCAAAAA ATTGACAATA TAAGTCTGGA TGAATTCGCA 
AAGGCATTAA AAAGTGTTTT GGCGAGAATA TGA

Protein sequence

MFLASLLRRI AFSYYDYKAY NFNIEKTDFV VIHIPDQIGD AMAIFPVIRA LELHKIKHLL 
IVTSTINLEV FNALKLEKTK LTLVTMTMQD HATLKEIKDL AKNITQKYGT PDLCIEAMRK 
KNLKTMIFIS QLKAKTNFQV VGLTMKCYSP LCKNASRMDQ NLRAPVPMTW AFMMREAGFP 
AVRPIYELPL SEDVLDEVRE EMRSLGSYIA LNLEGSSQER TFSLSIAENL IAKIQSETDI 
PIVIVHGPKG EDKARVLVDC YNNVYRLSLS PSIKRSAAII KDAYIAITPD TSILHMASAY 
NTPVVAIYAD YKTRWPAMAD VSESVVVGQK IDNISLDEFA KALKSVLARI