Gene BURPS668_0878 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_0878
Symbol
ID	4884313
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	856260
End bp	857561
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	68%
IMG OID	640126806
Product	hypothetical protein
Protein accession	YP_001057929
Protein GI	126441313
COG category
COG ID
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.717121
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAACAG GACGTCGACA CTTCGTGCGC TCGGTTGCGA GCGCCTCGGC CGCGCTCGCG 
GCCGCCGCAT GGTCCCCGGC GCGCGCCGCA ATCGACGCGC CCGCCTCGCC CGCGACCGCG 
CTGTCGCTCA CGCCCGGGCG CTGGTCGCCG AACAACGTCG CGCGGCTGCG CGCGGTGCTC 
GCCGGGCACG GCGCGTCGAG CCCGCGCTAC CGCCCCGAGC ACCGCCCGTA CGCGGTGTTC 
GACTGGGACA ACACGAGCAT CATGAACGAC TGCGAAGAAG CGCTGCTGAT GCACCAGATC 
GACGGGCTGC ATTACCGGCT CACGCCCGAG CAGTTCTCGG CGATCCTGCG CCAAGGCGTG 
CCCGACGGCC CGTTCGACGC GAAGCTCGGC TATACGAGCG TCGACGGCAA GCCCGTGCGG 
ATGGAGGACA TCGCGGCCGA CGTCGACGCC GACTACCGGT GGCTGCATGC GAACTATCGC 
GGCCTCGCGG GCGACAAGCC GCTCGACGAG ATCCACCGCA GCGAGCCGTT CCGGGATTTC 
CGCGCGAAGC TGTACTTCAT GTACGACGCG ATCTGCGACA CGTATCCGGT CGAGATCGGC 
TACAAGTGGA TCATGTACTG GTACGCGGGC ATGACGCGCG ACGAGTTGCA GGCGATGGCG 
TTCGACAGCA ACGTCGCGAA CCTCGGCGAC GCGCTGCGCA AGGTGACCTA CGAAAGCTCG 
CGCGCGCTGC CGGGCAAGGC GGGCGTCATC GCCGCGACGC ACTTCCACGG CATCCGCATC 
CACGAGGAGA TCCGCGCGGT GATGGACACG CTGCGCTCGA ACGGCATCGA CGTGTACGTC 
AGCACCGCAT CGCTCGACGA CGTCGTGCGC GTGTTCGCGG GCCATCCGGC GTTCGGCTAC 
GGCGTGCCCG CCGAAAACGT GATCGGCATG CGGCTCACGA TGGCGGACGG CAAGTACATG 
AACGAATACC TGCCGAACTG GCACTTCAAC TACGGGCCGG GCAAGACGGA CGGCATCCGC 
CGCGAGCTCG AAGCGAAGAA GGGCTACGGG CCGCTGCTCG TGTTCGGCGA CAGCGACGGC 
GACGCGTGGA TGCTGCGCGA CTTCGCCGAT ACCGCGGTCG GCGTGATCGT CAACCGGATG 
AAGAAAGGCG AGATCGGTAT CGACAGCCGC AAGGCGGCCG AGCAGATCGG CGCGAAGGAC 
GCGCGGCTCG TGCTGCAAGG GCGCGACGAG AACACCGGGC TGATGGTCGC CGACGAGCGC 
TCGATCAAGT ACGGCAAGCG CGATCCCAAA CTGCTCGCGT GA

Protein sequence

MKTGRRHFVR SVASASAALA AAAWSPARAA IDAPASPATA LSLTPGRWSP NNVARLRAVL 
AGHGASSPRY RPEHRPYAVF DWDNTSIMND CEEALLMHQI DGLHYRLTPE QFSAILRQGV 
PDGPFDAKLG YTSVDGKPVR MEDIAADVDA DYRWLHANYR GLAGDKPLDE IHRSEPFRDF 
RAKLYFMYDA ICDTYPVEIG YKWIMYWYAG MTRDELQAMA FDSNVANLGD ALRKVTYESS 
RALPGKAGVI AATHFHGIRI HEEIRAVMDT LRSNGIDVYV STASLDDVVR VFAGHPAFGY 
GVPAENVIGM RLTMADGKYM NEYLPNWHFN YGPGKTDGIR RELEAKKGYG PLLVFGDSDG 
DAWMLRDFAD TAVGVIVNRM KKGEIGIDSR KAAEQIGAKD ARLVLQGRDE NTGLMVADER 
SIKYGKRDPK LLA