Gene EcSMS35_3958 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3958
Symbol	rfaC
ID	6143135
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4035974
End bp	4036945
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	51%
IMG OID	641618784
Product	ADP-heptose:LPS heptosyl transferase I
Protein accession	YP_001745923
Protein GI	170682077
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID	[TIGR02193] lipopolysaccharide heptosyltransferase I

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0259947
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGTTC TGATCGTTAA AACATCGTCG ATGGGCGATG TTCTCCATAC GCTGCCCGCA 
CTCACTGATG CCCAGCAGGC AATCCCAGGG ATTAAGTTTG ACTGGGTGGT GGAAGAAGGG 
TTCACACAGA TTCCTTCCTG GCACGCCGCC GTTGAGCGAG TTATTCCTGT GGCAATACGT 
CGCTGGCGTA AAGCCTGGTT CTCGGCCCCC ATAAAAGCTG AACGCAAAGC GTTTCGTGAA 
ACGCTACAAG CAGAGAATTA TGACGCAGTT ATCGACGCTC AGGGGCTGGT AAAAAGCGCA 
GCGCTGGTGA CGCGTCTGGC GCATGGCGTA AAGCATGGAA TGGACTGGCA AACCGCTCGC 
GAACCGTTAG CCAGCCTGTT TTACAATCGT AAACATCATA TTGCAAAACA GCAGCACGCC 
GTAGAACGCA CCCGCGAACT GTTTGCCAAA AGTCTGGGCT ATAGCAAACC ACAAACCCAG 
GGCGATTATG CTATCGCACA GCATTTCCTG ACGAACCTGC CTACAGATGC TGGCGAATAT 
GCCGTATTTC TTCATGCAAC AACCCGAGAT GATAAACACT GGCCGGAAGA ACACTGGCGA 
GAATTGATTG GTTTACTGGC TGATTCAGGA ATACGGATTA AACTTCCGTG GGGCGCGCCG 
CATGAGGAAG AACGGGCGAA ACGACTGGCG GAAGGATTTG CTTATGTTGA AGTATTGCCG 
AAGATGAGTC TGGAAGGCGT TGCCCGCGTA CTGGCTGGGG CTAAATTTGT AGTGTCGGTG 
GATACGGGGT TAAGCCATTT AACGGCGGCA CTGGATAGAC CCAATATCAC GGTTTATGGA 
CCTACCGATC CGGGACTAAT TGGTGGGTAT GGGAAGAATC AGATGGTTTG TAGGGCTCCG 
GGGAATGAGT TGTCTCAATT GACAGCAAAT GCTGTTAAGC GGTTCATTGA AGAAAACGCT 
GCCATGATTT AA

Protein sequence

MRVLIVKTSS MGDVLHTLPA LTDAQQAIPG IKFDWVVEEG FTQIPSWHAA VERVIPVAIR 
RWRKAWFSAP IKAERKAFRE TLQAENYDAV IDAQGLVKSA ALVTRLAHGV KHGMDWQTAR 
EPLASLFYNR KHHIAKQQHA VERTRELFAK SLGYSKPQTQ GDYAIAQHFL TNLPTDAGEY 
AVFLHATTRD DKHWPEEHWR ELIGLLADSG IRIKLPWGAP HEEERAKRLA EGFAYVEVLP 
KMSLEGVARV LAGAKFVVSV DTGLSHLTAA LDRPNITVYG PTDPGLIGGY GKNQMVCRAP 
GNELSQLTAN AVKRFIEENA AMI