Gene BURPS668_1759 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1759
Symbol
ID	4884802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	1736332
End bp	1737987
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	66%
IMG OID	640127687
Product	hypothetical protein
Protein accession	YP_001058798
Protein GI	126440716
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2831] Hemolysin activation/secretion protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.301432
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGCTGC TCGCGCTCGT CGCGGCCGCC GGCGCCGCGC ACGCGCAAAG CCGCTCGGGC 
GGCAATCCGC TGGAAGCCCT CCCGCAGATC AACACGCCGC AAAAGCCGAG CGTCACCGTG 
CAGGTCGCGC CGCAGGAAGT CCAGGTGCAG GCGCTGCTCG CGCGCCATCT GACGCCGAGC 
TCGTTCCAGG TCGAAGGCGT CAAGTCGATT CCGTTCGAAG AGATCTCGCA ACGCTTCACG 
CCGCTCGTCG GCAAGAACAT CACGATCGGC CAGTTGATCG AGACGGCGAA CGGCGTGACC 
AAGCTGTACC AGGAGCGCGG CTACGCGCTG TCGTTCGCGT TCGTTCCCGC GCAGACGTTC 
GAAGGCGGCG TCGTGCGCGT GACGGTCGTC GAAGGCTATG TCGCGAACGT GAAGATCACG 
GGCCGCCCCG GCGCGATGGA GCCGAAGGTG CGCGCGATCG CCGCGCACAT CATGGCCGAC 
CGCCCGCTGC GCCGCGCGAC GTTCGAGCGC TACGTCAACA CGTTCGGCCT GCTGCCCGGC 
GTGACGGTGA AGGCGAACGT GCCGCCGCCG CAGAATACCG ACGGCGCGAC GACGCTCGAG 
CTCAACGTCG ATCGCAAGCC GTTCAACGTG AGCGCGGGCC TGAACACGAA CAATCCGGGC 
CTGCAGGGGC TGTTCACGGT GACGGAGAAC GGACTCACGT CGCTCGGCGA GCAGATGAGC 
ATCTCCGCGC TGTTCCCGAA AGGGCCGAAC AATCAGACGT ACGTGTCGTT CAACGGCGCC 
GTGCCGATCG GCAGCAACGG CCTCGTCACG CGTCTGGACG CGAGCCACTA TCGCGGCAAT 
CCGTCCGTCG ATCAGACCGT GCTGCCGAAC GTGCAGCGCA CCGTGATCAA CGACAAGCTC 
GGCCTGTCGG CGTCGTATCC GCTGATGCTG AGCAACCAGC GCAGCCTGCT CGGCACGGTG 
TCGGGCTATG CGTCGCACAG CGAGGATCGC TACCAGAACC AGAGCACGGG CGCGACGATC 
GGCATGCGCT CGCAGGTGCG CGTGCTGCAG ATGCAGTTCG ACTACACGAG CGTGCAGCCG 
AAGCAGGTGC AGAAGCTGAG CTTCAACGTC GCCAAGGCGT TCGACATCCT GGGCGCGTCG 
AAATCGGGCT TCACGAACCT GCCGGGCGTC ATCGCGACGA ACCCCGCGTC GACGACGTTC 
GTGCGCACGG GCGCCACGTT CGTGCAGACG AACGAGTGGC CGTTCAAGAT CGGCTCGACC 
GTGCAGCTCA CCGGCCAGTA CAGCCCCGAT TCGCTGCCGA GCACCGAGCA GATCTCGTTC 
GGCGCGCAGC GTTTCGCGCT CGGCTATCAG CCGGGCGAGA CGTCGGGCGA TTCGGGCTGG 
GGCGCGTCGC TCGAGCTCAA TCGCGCGTTC GCGCCGGGCT TCACGTACCT GAAGAACATC 
ACGCCGTACA TCGTGTACGA CATGGCGCGC GTCTATCTGC ATTCGGGCAC GCCGGTGCCG 
CGCCGCCTGT CGTCGGCCGG GTTCGGCGTG CGGTTGACCG ACAGCCGCTT CTACAATCTC 
GACGTGTCGA TCGCGAAGCC CGTCGGCGAC GCGCCGATCG AAAGCGCATC GCGCAGCCCG 
CGCGTGAACG CCTCGTTCTC GTATCAACTC TATTGA

Protein sequence

MLLLALVAAA GAAHAQSRSG GNPLEALPQI NTPQKPSVTV QVAPQEVQVQ ALLARHLTPS 
SFQVEGVKSI PFEEISQRFT PLVGKNITIG QLIETANGVT KLYQERGYAL SFAFVPAQTF 
EGGVVRVTVV EGYVANVKIT GRPGAMEPKV RAIAAHIMAD RPLRRATFER YVNTFGLLPG 
VTVKANVPPP QNTDGATTLE LNVDRKPFNV SAGLNTNNPG LQGLFTVTEN GLTSLGEQMS 
ISALFPKGPN NQTYVSFNGA VPIGSNGLVT RLDASHYRGN PSVDQTVLPN VQRTVINDKL 
GLSASYPLML SNQRSLLGTV SGYASHSEDR YQNQSTGATI GMRSQVRVLQ MQFDYTSVQP 
KQVQKLSFNV AKAFDILGAS KSGFTNLPGV IATNPASTTF VRTGATFVQT NEWPFKIGST 
VQLTGQYSPD SLPSTEQISF GAQRFALGYQ PGETSGDSGW GASLELNRAF APGFTYLKNI 
TPYIVYDMAR VYLHSGTPVP RRLSSAGFGV RLTDSRFYNL DVSIAKPVGD APIESASRSP 
RVNASFSYQL Y