Gene SbBS512_E4048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4048
Symbol	rfaC
ID	6273300
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	3780766
End bp	3781746
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	51%
IMG OID	641727888
Product	ADP-heptose:LPS heptosyl transferase I
Protein accession	YP_001882320
Protein GI	187733685
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID	[TIGR02193] lipopolysaccharide heptosyltransferase I

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0000904915
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGGTTT TGATCGTTAA AACATCGTCG ATGGGCGATG TTCTCCATAC GTTGCCCGCA 
CTCACTGATG CCCAGCAGGC AATCCCAGGG ATTAAGTTTG ACTGGGTGGT GGAAGAAGGG 
TTCGCACAGA TTCCTTCCTG GCACGCTGCC GTTGAGCGAG TTATTCCTGT GGCAATACGT 
CGCTGGCGTA AAGCCTGGTT CTCGGCCCCC ATAAAAGCTG AACGCAAAGC GTTTCGTGAA 
GCGCTACAAG CAGAGAACTA TGACGCAGTT ATCGACGCTC AGGGGCTGGT AAAAAGCGCG 
GCACTGGTGA CACGTCTGGC GCATGGCGTA AAGCATGGAT TGGACTGGCA AACCGCTCGC 
GAACCTTTAG CCAGCCTGTT TTACAATTGT AAGCATCATA TTGCAAAACA GCAGCACGCC 
GTAGAACGCA CCCGCGAACT GTTTGCCAAA AGTTTGGGCT ATAGCAAACC GCAAACCCAG 
GGCGATTATG CTATCGCACA GCATTTTCTG ACGAACCTGC CTACAGATGC TGGCGAATAT 
GCCGTATTTC TTCATGCGAC GACCCGTGAT GATAAACACT GGCCGGAAGA ACACTGGCGA 
GAATTGATTG GTTTACTGGC TGATTCAGGA ATACGGATTA AACTTCCGTG GGGCGCGCCG 
CATGAGGAAG AACGGGCGAA ACGACTGGCG GAAGGATTTG ATTATGTTGA AGTATTGCCG 
AAGATGAGTC TGGAAGGCGT TGCCCGCGTG CTGGCCGGGG CTAAATTTGT AGTGTCGGTG 
GATACGGGGT TAAGCCATTT AACGGCGGCA CTGGATAGAC CCAATATCAC GGTTTATGGA 
CCAACCGATC CGGGATTAAT TGGTGGGTAT GGGAAGAATC AGATGGTTTG TAGGGCTCCG 
GGGAATGAGT TGTCTCAATT GACAGCAAAT GCTGTTAAGC GATTCATTGA AGAAAACGCT 
GAAAACGCTG CTATGATTTA A

Protein sequence

MRVLIVKTSS MGDVLHTLPA LTDAQQAIPG IKFDWVVEEG FAQIPSWHAA VERVIPVAIR 
RWRKAWFSAP IKAERKAFRE ALQAENYDAV IDAQGLVKSA ALVTRLAHGV KHGLDWQTAR 
EPLASLFYNC KHHIAKQQHA VERTRELFAK SLGYSKPQTQ GDYAIAQHFL TNLPTDAGEY 
AVFLHATTRD DKHWPEEHWR ELIGLLADSG IRIKLPWGAP HEEERAKRLA EGFDYVEVLP 
KMSLEGVARV LAGAKFVVSV DTGLSHLTAA LDRPNITVYG PTDPGLIGGY GKNQMVCRAP 
GNELSQLTAN AVKRFIEENA ENAAMI