Gene BURPS668_A3087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A3087
Symbol
ID	4886867
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	2927396
End bp	2928652
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	69%
IMG OID	640133023
Product	hypothetical protein
Protein accession	YP_001064078
Protein GI	126442905
COG category	[S] Function unknown
COG ID	[COG4655] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTCGCG TCACTTCCTC GTCAGGCGGC GCCCGTCCAT GCGGGCGCCG CCGCCAGCGC 
GGCGTCGTGT CGATTCTCGT CGCGCTGATG CTCGCGGTGC TGATCGGCTT CGTCGGCCTC 
GCGCTGGATC TCGGCAAGCT CTACGTGACG CGCAGCGAGC TGCAGAACAG CGCGGACGCG 
TGCGCGCTCG CCGCGGCGCG GGATCTGACG GGTGCCATCA ATCTGTCCGT GCCGGAGGCG 
GCCGGCATCA CCGCCGGCCA CCTCAACTAC GCGTTGTTCG AGCAGTTTCC GGTTCAGATG 
CAGACGAACT CGAACGTCAC GTTCAGCGAT TCGCTGAGCA ATCCGTTTCA ACCGAAGAAC 
GCGATCGCGT CGCCTTCGTC GATCAAGTAC GTGAAGTGCA CGACATCGCG CACGGGCATC 
GTCAACTGGT TCATCCAGAC GCTCAACCTG GTGCCGGGCG TGACCGTGGC GAACGCGTCG 
GTGTCCGCGA CGGCCGTGGC GACCGTCGGC GCCGCGCAGA CCACCTGCGC GATTCCGGTG 
TTCATCTGCA AGGCCGGCAC GCAGACGAGC CCGCCCGTGG CCGGCGCGAC CTACAACATC 
GGCGACTGGC TCTCCGCGAA GACGGGCTCG CCGCCGTCGT TCGGCGCGGG CAACTTCGGC 
TGGTCGGCGC TCGACGGCTC GAACAGCGCG TCGTCGATCG CCAACGAGCT GACGGGCAAC 
TACTGCGCGC TGCCCGCCAC CGGCTCGCAG GTCGGCACGC CCGGCGACAA GGCGGCGACG 
ACCAACGCGT ACAACACGCG CTTCGGCATC TACGCGAATC CGTACAAGAA CCCGTCGTAC 
GGCACGCCCG ACTTCACCGG CTTCGCCTAC GACGCGACCA CATGGCCCTC GCAGAGCAAC 
GCGTATTCGG ACTTCGTCAG CAAGCGCCTG GCGTTCGCGA GCTATCAGGG CGACCTGATC 
ACCGGCATCA ACACGGGCGG CTCGTACAAC CCGAGCTACT ACGCGGCGGG CGCCGACCGC 
AGGCTCGCGC TCGCGCCCGA GGTGGACTGC TCGGTGCTGC TGAGCGGCCA CAGCGCGCCC 
GTGCTCTCGT GGGATTGCGT GCTGATGCTC GACCCGATGG GCTCCGGCGG CAGCGCGACG 
CCCGTGCATC TCGAGTACCG CGGCTCGTCG ACCGCGTCCG GCAGCCCGTG CGCGACGCAA 
GGCACGCCGG GCAACGGCAG CTCGGTCGGC CCGCAGGTGC CCGTGCTGCT CCAATGA

Protein sequence

MSRVTSSSGG ARPCGRRRQR GVVSILVALM LAVLIGFVGL ALDLGKLYVT RSELQNSADA 
CALAAARDLT GAINLSVPEA AGITAGHLNY ALFEQFPVQM QTNSNVTFSD SLSNPFQPKN 
AIASPSSIKY VKCTTSRTGI VNWFIQTLNL VPGVTVANAS VSATAVATVG AAQTTCAIPV 
FICKAGTQTS PPVAGATYNI GDWLSAKTGS PPSFGAGNFG WSALDGSNSA SSIANELTGN 
YCALPATGSQ VGTPGDKAAT TNAYNTRFGI YANPYKNPSY GTPDFTGFAY DATTWPSQSN 
AYSDFVSKRL AFASYQGDLI TGINTGGSYN PSYYAAGADR RLALAPEVDC SVLLSGHSAP 
VLSWDCVLML DPMGSGGSAT PVHLEYRGSS TASGSPCATQ GTPGNGSSVG PQVPVLLQ