Gene BURPS1106A_3118 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3118
Symbol	rfaC
ID	4902997
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	3037968
End bp	3039035
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	71%
IMG OID	640136344
Product	lipopolysaccharide heptosyltransferase I
Protein accession	YP_001067356
Protein GI	126452253
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID	[TIGR02193] lipopolysaccharide heptosyltransferase I

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.145361
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCGGCCG CCCGGCGCGA TAAAATCCGT CCTTTCGGTC TGTGCCGGCC GCCGCCGGCC 
CTTTTTTTCA GCGTGCAAAA AATTCTGATC GTGCGCGTGT CGTCGCTCGG CGATGTCGTG 
CATAACATGC CGGTGATCGC CGATATCCGC CGGCGTCACC CCGATGCGCA GATCGACTGG 
CTCGTCGAGG AAGGCTTCGC CGATCTCGTG CGGCTCGTCG ACGGTGTGCG CGACGTGCTG 
CCGTTCTCGC TGCGGCGCTG GCGCAAGCGC TTGAGCGCAT CGCAAACGTG GCGCGAGATC 
CGCGCGTTCC GGCGGCGCCT CGCCGAGGAG CGCTACGACC TCGTGATCGA CTGCCAGGGG 
CTCATCAAGA CCGCGTGGGT CGCGAGCTGG GCGCGCGGGC CGCTTGTCGG CCTCGGCAAC 
CGCACCGACG GCGCCGGCTA CGAGTGGCCG GTGCGCTTCT TCTACGACAG GCGGGTGCCG 
ATCGCGCCGC GCACGCACGT CGTCGAGCGC TCGCGGCAGC TCGTCGCGGC GGCGCTGGGA 
GACCCCGCGC CGGCGCCCGG CGAGCCGATC GATTTCGGCC TCGACACGCA TGGCGCGGCG 
CGCGCGCTCG CGGCGCTCGA TTTGAATCTG CCGGTGCCCT ACGTGGTATT CGTGCACGCG 
ACCTCGCGCG CCGACAAGCA GTGGCCCGAC GAAGCGTGGA CCGGCCTCGG CGAGGCGCTC 
GTGCGGCGCG GCGCGTCGCT CGTGCTGCCG TGGGGCAGCG ACGCCGAGCG CGCGACGAGC 
GAGCGCCTCG CGAAGGCGTT CGGCGCGGCG GCGATCGTGC CGCCGAAGCT GTCGCTGCCC 
GCGGTCGTCG GCCTCGTCGA CGGCGCGGCG GCGACGGTCG GCGTCGATAC CGGCCTCGTC 
CACATCGCGG CGGCGCTCAA GCGTCCGACC GTCGAACTGT ACAATTTCGC GACAGCCTGG 
CGCACGGGCG GCTACTGGTC GCCCAACGTC GTCAATCTCG GCACCGCCGG CGCGCCGCCG 
TCCCTTTCGC AGGCGAAGGA CGCACTCGCG TCGTTCGGCC TCTTGTAA

Protein sequence

MSAARRDKIR PFGLCRPPPA LFFSVQKILI VRVSSLGDVV HNMPVIADIR RRHPDAQIDW 
LVEEGFADLV RLVDGVRDVL PFSLRRWRKR LSASQTWREI RAFRRRLAEE RYDLVIDCQG 
LIKTAWVASW ARGPLVGLGN RTDGAGYEWP VRFFYDRRVP IAPRTHVVER SRQLVAAALG 
DPAPAPGEPI DFGLDTHGAA RALAALDLNL PVPYVVFVHA TSRADKQWPD EAWTGLGEAL 
VRRGASLVLP WGSDAERATS ERLAKAFGAA AIVPPKLSLP AVVGLVDGAA ATVGVDTGLV 
HIAAALKRPT VELYNFATAW RTGGYWSPNV VNLGTAGAPP SLSQAKDALA SFGLL