Gene BURPS668_1125 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1125
Symbol
ID	4882101
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	1102625
End bp	1104382
Gene Length	1758 bp
Protein Length	585 aa
Translation table	11
GC content	62%
IMG OID	640127053
Product	hemolysin activation/secretion protein
Protein accession	YP_001058175
Protein GI	284159912
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2831] Hemolysin activation/secretion protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.000467799
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAATTC GTTCGTCCGC CGTCCTACTG TCGATTGCCT CCCTTGTGCC ATTGGTAGGA 
TATACACAGC AGGTACCGTC CCCTGCCGAC CAAGCCGCAG CCGCGCGCGC CAATGCGGAA 
CAGGACCGGC AGGCGCAGCA GCAACGAGAT GCGCAGCAGC GCGATGCGGC CGTGCGTGCC 
CCGTCCGTGC GCTCCGAGGT GCCGAAGGTC GAAGCGTACC CGGCGCTCCC GGCGGAAGCA 
CCATGCTTTC GTATCGATCG CTTTACGCTC GACGTACCCA ACTCCTTGCC CGACACGACG 
AAGGCACAGG GGGCGTCCGC CCTCCCGATG GATCGCTTCG CGTTCGCCCG TGCCTGGCTG 
AACCACTACG CCGGCCAATG CGTCGGCAAG CAAGGCGTTG ACGTGCTGGT CAAAGAGCTC 
TCTCAAGCGA TTCTGGCGCG CGGCTACGTC ACCACACGCG TGCTCGTCCC CGAGCAAGAC 
CTGTCGGCCG GCACGCTGAA ATTCTCGCTG ATTCCCGGCG TGATTCGCCA TGTGCGCTTC 
GCCGACGAAA AACTGCGCGG CACATGGAAG ACCGCGTTCC CGACCGGTGA CGGCGAAGTG 
CTGAACCTGC GCGACCTCGA ACAAGGCCTT GAGCAGATGA AGCGCGTGAC GAGCCAGGAT 
GTCTCGATGC AGATTGTTCC CGGCGAGCTG CCCGGTGAAA GCGATGTCGT GCTCGATGTG 
AAGCGCAGCA AGCCGTGGAC CGTCGTCGCA TCGATCGACA ATTCTGGCAC ACGCGCTACG 
GGCAAGCTGC AAGGCAACCT GTCGGTCGGC GTCGACAATC CGCTTGGCCT GAACGACATG 
CTCAACGTTG GCGTCAGCCA AGACCTCGAA TTCGGCGACA AGCGCCTCGG CTCGCACGGC 
TGGAACGGCT TCTATTCGAT TCCGTGGGGT TACTGGACTG CCACGCTGTC CGCATACACG 
AACACCTACT ATCAGCAGAT TGCGGGTGTG AACCAGACAT TCATCGCGAG CGGCAACTCG 
AAGACAGTCG ATCTCAAACT GGCTCGGGTG CTGGCGCGCA GCCAGAACGA CGTGCTCGGA 
GGGTATTTCC GGCTGTCCCG CCGTTTCGGC GAGAGCTTTA TCGAGGACAC TGAGATTTCG 
CAACAGCGTC GTAACAACAC GATCATCGAA CTCGGTTTGA CCGACCGGCA CTACTTCGAC 
GGCGCGCAAT TCGACGGCTC GCTCGCATAT CGTCAAGGTG TCGGCGGATT CGGCGCGCAG 
GACGACACAC TGGCGGCGAG CGGCTCGACC TATCGCTTCA AGATGGCCGT GCTCGACGCG 
AACCTCTCGG TGCCGTTTGC AATCGGCGAA CAACCGTTCC GCTACGTTGG AACGTTCCAC 
GGCCAGTACA CCGGAAACAC GCTCTACTAC CTCGATGACC TGACGATCGG CAGCCGATAT 
ACCGTGCGCG GCTTCGACGG AGAAACGATG CTGGCGGCGT CGCGCGGGTT CTACTGGCGT 
AACGAGTTGC AAATGCAGAT TGGCCAGACG AGGCAAGCGG TGTATGCAGG GCTGGATTAC 
GGGCGCGTGT GGGGGCCTCA GCCGATTGCG CTCGTCGGTA CGCAGTTGGC CGGCGCCGTC 
ATCGGTATGA AGGGAAGCAT CGGGACGCGC TTCGGTGCCT ACGCGTATGA CCTGTTTGCA 
GGCACGCCTG TCTATAAGCC GTCCGGCTTT CCAACTGCGC GTGTCACCGT CGGATTCCAA 
CTGACTTCGC AGTTTTGA

Protein sequence

MRIRSSAVLL SIASLVPLVG YTQQVPSPAD QAAAARANAE QDRQAQQQRD AQQRDAAVRA 
PSVRSEVPKV EAYPALPAEA PCFRIDRFTL DVPNSLPDTT KAQGASALPM DRFAFARAWL 
NHYAGQCVGK QGVDVLVKEL SQAILARGYV TTRVLVPEQD LSAGTLKFSL IPGVIRHVRF 
ADEKLRGTWK TAFPTGDGEV LNLRDLEQGL EQMKRVTSQD VSMQIVPGEL PGESDVVLDV 
KRSKPWTVVA SIDNSGTRAT GKLQGNLSVG VDNPLGLNDM LNVGVSQDLE FGDKRLGSHG 
WNGFYSIPWG YWTATLSAYT NTYYQQIAGV NQTFIASGNS KTVDLKLARV LARSQNDVLG 
GYFRLSRRFG ESFIEDTEIS QQRRNNTIIE LGLTDRHYFD GAQFDGSLAY RQGVGGFGAQ 
DDTLAASGST YRFKMAVLDA NLSVPFAIGE QPFRYVGTFH GQYTGNTLYY LDDLTIGSRY 
TVRGFDGETM LAASRGFYWR NELQMQIGQT RQAVYAGLDY GRVWGPQPIA LVGTQLAGAV 
IGMKGSIGTR FGAYAYDLFA GTPVYKPSGF PTARVTVGFQ LTSQF