Gene BURPS1106A_A0149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0149
Symbol
ID	4906291
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	138523
End bp	139572
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	67%
IMG OID	640143256
Product	hypothetical protein
Protein accession	YP_001074192
Protein GI	126458527
COG category	[S] Function unknown
COG ID	[COG3520] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03347] type VI secretion protein, VC_A0111 family

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.158561
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGCGC ATCCGCCCGC CGCCCGGCCC ATCGACGCCC ACTCGCCCCT GCATCCGGAC 
GCACTGCGGG CATGGTTCGA TCCGCAAGCG CCGTGGCGCG CCGGCTTTCT GAGCCTGTTG 
CGCGCAATCG CCGCACGCGA CACGCGCATG CCCTTGCCCG GAACGGCGTG TCTGCCGAAG 
GAAGAGGCGT TTCGCATCGG ACAACGGCCG TCGATGGCCT TCGCGCCGCG CGAGATCGCA 
TCGCTCGACG TGCAGCGCGG GCGTCTCGAC ATTCAGCTGT TCGGCCTCGG CCTATGGGGG 
CCGCAGGGGC CGTTGCCGCT TCACATGACC GAGCTCGCGT ACAACCGCGC CGAGAGCTAT 
CAGGATCATG CGATCGCGCA TTTCTCCAAT CTCTTTCACC ATCGTGCGCT CGCGTTGTTC 
TATCGTGCGT GGGCGTCGTC ACAGGCGACC GTATCGCTCG ATCGCGCCGA GCACGAAACG 
TTCTCGTTCT ATATCGGCAG CCTGATGGGC ACCGATCCCG AAGAAGCCGC GCGTACGCAC 
CCGCCCACGC ACGCGCGGTA CGCCGCATGC GCGCATCTCG TGCGCGAGGC GCGCAATCCG 
GACGGCGTGG CCGCCACGCT GTCGCATTAC TTCGGCGTGC CGATCGCCGT CGACGAATAC 
GTCTTCCACT GGATCCGGAT TGCGCCGCCG GAGCGTTGCC TGCTCGGCGC GCGCGCCGCA 
TCGACCGTCA TGGGCGAGGG CGCGCTGCTC GGCGACATGG TTGCCGATTG CCAGCACAAG 
TTCCGGCTCG TCATCGGCCC GCTCGATCTC GACCAATATC TTCGCCTGAC GCCGCACGGC 
AACGATCTGC CGACCCTGGT CGATTGGGTG CGCGCCTTCG TCGGTCACGA ATACGACTGG 
GAGATCAAGC TGCTCGTCAA GCCACGCGCC GCGCCGCCCG CCCGCGCGGA TACCACGCAC 
CGCCTCGGCT ATTCGACCTG GCTCGGCGAA TCGAGGGACG ACAGGCCGGT CGTCGGCATG 
GTGTTCGAGC CGGAAAAATA CTGTTCCTGA

Protein sequence

MTAHPPAARP IDAHSPLHPD ALRAWFDPQA PWRAGFLSLL RAIAARDTRM PLPGTACLPK 
EEAFRIGQRP SMAFAPREIA SLDVQRGRLD IQLFGLGLWG PQGPLPLHMT ELAYNRAESY 
QDHAIAHFSN LFHHRALALF YRAWASSQAT VSLDRAEHET FSFYIGSLMG TDPEEAARTH 
PPTHARYAAC AHLVREARNP DGVAATLSHY FGVPIAVDEY VFHWIRIAPP ERCLLGARAA 
STVMGEGALL GDMVADCQHK FRLVIGPLDL DQYLRLTPHG NDLPTLVDWV RAFVGHEYDW 
EIKLLVKPRA APPARADTTH RLGYSTWLGE SRDDRPVVGM VFEPEKYCS