Gene BURPS1106A_3274 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3274
Symbol
ID	4901135
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	3189624
End bp	3190913
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	58%
IMG OID	640136500
Product	capsule polysaccharide biosynthesis protein
Protein accession	YP_001067511
Protein GI	126452213
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3562] Capsule polysaccharide export protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACGGGCT GCAAGGCGGG TGTTGTCATT TTGTCGGCGA CTTGTTCGAG CGCGTCGGCC 
TTCATAACTC AATCAGATAA GAATCGTATG TCCCGCTTCT TCCTTGCCCT GCAAGGCACG 
GCCTCTCCTT TTTTTGGTCG ACTCGCTGCC GGTCTCGGCC AGCGGGGCCA CCAGGTTCGG 
CGTGTGAATT TTTGCGGCGG AGATCTCGCG TATCAAGGTT CGGAAAGCGC TTGGAACTAT 
CGCGACGAAC CCGAAGGCCT GGTTGCGTGG TATCGCGATG CCATTGCGAC CAATGGAGTG 
ACGGATGTGC TTCTGTTTGG CGACTGCCGT GCGATCCACC GGCCGATGCA TGAGATCGCT 
CGCGCATCGG GGGTGCGTGT TCACGTATTC GAAGAGGGGT ATGTTCGACC GCACTGGATC 
ACAATGGAAA GGCACGGCGT CAACGGCCGA TCGTTGCTGC CGCGCGACCC GGCTTACTAT 
CTCGACGCAC GCCGGCATAT CCCGCCAGCG GTACCCGGGA AACCGACCGG CTACAACCTG 
TACGAGCGCG CCTGCCACGA TATCAGGTAT CGCATGGCCA ACGCGTTGTA CGCGCATCGT 
TTCCCGCATT ACAAGTCGCA CCGTCCGAGA AACGGCTTAC AGGAGTACGC GGGCCTCGCG 
TATCGCGCCG TTCAGCAACA CGTGCGCGAT AGGGAGGCCG AGAACGTCAC CCGTGATCTG 
CTGGAACGAA AACGCCGCTA CTATCTGTTT CCGCTGCAGC TCAATTCCGA CTCCCAGATC 
GTCGATCATT CCCCTTTTGG CGGCATTTGC GACGCGATAG CGATTGTTTT ACACTCATTC 
GCCGAAAATG CGCCCGACGA CAGTTGGCTT GTCATCAAGA ATCATCCGTT GGACACCGGT 
CTGATCGGCT ACCGTCAATT TGCAACGGCA TTGGCCACTG AACTGGGTAT CGAGAAGAGA 
ATGGCCTTCA TCGATGCGGG CCACTTGCCG ACGTTACTCG ATCAATGTCG TGGCGTGGTC 
GTGATAAACA GCACGGTCGG TTTGTCCGCC GTCCACCATC GACGCCCGCT CGTTGCATTG 
GGCACCGCGA TCTATTCGAT GCCGGGGCTG ACTTGGCAAG GCAGCCTGGC GGACTTTTGG 
ACGGAGGCTG GTAGCCCGGA CATGAATCTC TATCAGGCTT TTCTCGACTA CGTGATGCAC 
CATACGCAGA TCAACGGAGA TTTCTATACG CGCACCGGTA TAGAGATGAG CGTCGCCGGC 
GCCGTGAGCC GGCTCGAGGC GGTGTCGTGA

Protein sequence

MTGCKAGVVI LSATCSSASA FITQSDKNRM SRFFLALQGT ASPFFGRLAA GLGQRGHQVR 
RVNFCGGDLA YQGSESAWNY RDEPEGLVAW YRDAIATNGV TDVLLFGDCR AIHRPMHEIA 
RASGVRVHVF EEGYVRPHWI TMERHGVNGR SLLPRDPAYY LDARRHIPPA VPGKPTGYNL 
YERACHDIRY RMANALYAHR FPHYKSHRPR NGLQEYAGLA YRAVQQHVRD REAENVTRDL 
LERKRRYYLF PLQLNSDSQI VDHSPFGGIC DAIAIVLHSF AENAPDDSWL VIKNHPLDTG 
LIGYRQFATA LATELGIEKR MAFIDAGHLP TLLDQCRGVV VINSTVGLSA VHHRRPLVAL 
GTAIYSMPGL TWQGSLADFW TEAGSPDMNL YQAFLDYVMH HTQINGDFYT RTGIEMSVAG 
AVSRLEAVS