Gene BURPS1106A_A0238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0238
Symbol
ID	4904504
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	226627
End bp	227973
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	69%
IMG OID	640143345
Product	hypothetical protein
Protein accession	YP_001074281
Protein GI	126457249
COG category	[S] Function unknown
COG ID	[COG3522] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03353] type VI secretion protein, VC_A0114 family

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCTGGC ATAACAAGGT CGTCTGGAGC GAGGGGCTTT TCATGCGCCC GCAGCTGTTC 
CAGCAGCAGG AGCGCTATCT CGAGCACTAC GCGCACAAGC GCGCGGCGCC GCTGTCGCCG 
TTCTTCTTCG GCTTCAGCCA CTTCAGCCTC GACAGCGAGG CGCCGGCGCT CGGCAAGATC 
ATCGTGAAAT CGGCGAGCGG CGTGTTCGCC GACGGCACGC CGTTCGACGC GCCGGGCAGC 
ACGCCGCCGC CCGCGCCGCT CACGATCCGG CCCGAGCATC TGGACCAGGT GATCTACCTC 
GCGGTGCCGA TCCGCGTGCC GAACGGCGAG GAAACCGCAT TCGACCGCGC GGCCGAATCG 
CTCGCGCGCT ATGCCGTGTT CGAAACCGAC CTGCGCGACA CGAACTCGAT CGGGCAAGGG 
CCGAAGACGG TCCAGTTGTC GAACCTGCGC CTGCGGCTGC TTCCGGAAAA GGAACTGACG 
GACGCGTGGA TCGGGCTCGC GCTCACGCGC GTGAAGACGA TTCGCGCGGA CGCGAGCATC 
GAGCTCGACG ACATGCTGAT TCCGCCCGTG GTCGGCTACG GCGCGAGCGA CACGCTCGCG 
AGCTGGCTCG CGAAGATCCA CGATCTCACG CGCCTGCGCG CGAACGCGCT CGCCGAGCGC 
CTGACGGGCT CGGACGGCCG GGCGGGCACG ACGGCCGAAG TATCCGACTA CCTGCTGCTG 
CAAACGCTCA ATCGCTACGA GCCGCTGCTG AAACACCTGC AGCGCGTGCC CACGACGTCG 
CCCGCCGAGC TGTACGCGCT GCTCATCGGC ATGGCGGGCG AGCTGTCCAC CTACGTGCGC 
ACCGATACGC GCCGGCCGCT CGATACGCAC CCGCCCTATC AGCACGTCGC GCCGCATCTG 
TGCCTGAAGC CCGTCGTCGA CGACACGCAC CGGCTGCTCA ACGCCGTGCT CGTGCGCAGC 
GCGCAGCGCC TCGCGCTCGC CGATCTGGGG CACGGAATGC TCAACGCGGT CGTCGATCCG 
GTCGACATGC AGGGCTTCAC CGCGGTCGTG CTCGCGGTGC ATGCGCAGAT GCCGCCCGAT 
CTGCTGCAGC AGCAGTTCGC CGCGCAGGCG AAGGCGGGGC CGTCCGAGCG GCTGCCGGAC 
CTCGTGCGCA GCCATCTGTC CGGCATCGCG CTGCAGACGC TGCCGGTGCC GCCCCGGCAG 
ATCCCGTTCA ACGCCGGCTA CGTCTATTAC GAGCTCGCGC GCGGCGGGCC GCTGTGGGAC 
GAAGTCGCGC AGCACGGCGG GCTCGCGCTG CACATCGCCG GCGAATTTCC GTCGCTGAAG 
CTCGAGCTAT GGGGCATTCG CGGATAG

Protein sequence

MSWHNKVVWS EGLFMRPQLF QQQERYLEHY AHKRAAPLSP FFFGFSHFSL DSEAPALGKI 
IVKSASGVFA DGTPFDAPGS TPPPAPLTIR PEHLDQVIYL AVPIRVPNGE ETAFDRAAES 
LARYAVFETD LRDTNSIGQG PKTVQLSNLR LRLLPEKELT DAWIGLALTR VKTIRADASI 
ELDDMLIPPV VGYGASDTLA SWLAKIHDLT RLRANALAER LTGSDGRAGT TAEVSDYLLL 
QTLNRYEPLL KHLQRVPTTS PAELYALLIG MAGELSTYVR TDTRRPLDTH PPYQHVAPHL 
CLKPVVDDTH RLLNAVLVRS AQRLALADLG HGMLNAVVDP VDMQGFTAVV LAVHAQMPPD 
LLQQQFAAQA KAGPSERLPD LVRSHLSGIA LQTLPVPPRQ IPFNAGYVYY ELARGGPLWD 
EVAQHGGLAL HIAGEFPSLK LELWGIRG