Gene BURPS668_1837 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1837
Symbol
ID	4884356
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	1801396
End bp	1802457
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	71%
IMG OID	640127765
Product	permease
Protein accession	YP_001058872
Protein GI	126439253
COG category	[R] General function prediction only
COG ID	[COG0701] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAGCT CCCGTTCCTA TACACCGCAT CCGGCGCTCG GCCTCGCGAC GTTCGTCGTG 
CTGGCCGTCG CGGGCCTCTT CTACGTGAAG TGGTTTCCGT ATTATCACAA GGCGTTCGCC 
GCGGCCGAAC ACCATTCGAT CGGCCAGTCG ATCCTGATGG GCGCCGCGGC GCACGCGCCG 
CAGCCGTCGC TGCAGGCGGC GCTCGATTAC GCATGGGCGT ACGGCAAGGC GATCTGGCAG 
GCGATGGTGC TGGGCCTGCT GCTCGGTTCG GCCGTGCAGG CGCTGCTGCC CGCGCACTGG 
GTCGCGCGCG CGCTCGGCGG CACGGGCTTC GGCAGCGTCG CGGCGGGGGG GCTGCTGGCG 
CTTCCCGGCA TGATGTGCAC GTGCTGCGCG GCGCCCGTCG TCGCGGGCCT GCGCGAGCGC 
GACGCGTCGC CGGGCGGCGC GCTCGCGTTC TGGCTCGGCA ACACCGTGCT CAATCCCGCC 
GCGCTCGTGT TCATGGGCTT CGTGCTCGGC TGGCACTGGA GCGCGCTGCG GCTCGTGCTC 
GGCGTCGCGA TGGTGTTCGG CGTCGGTTAT CTGGTCAATC GCCTGGCCGG CGCGCAGCCG 
CGCGTCGTCG ACGATGCGCT TCGCGCGAAG CTCGTCGCCG AGCAGGCGGC GGTCGGCAAC 
GCGTTCGTGC GGTGGATGAA GATCTTCGCG CGGATGACCG TGCGCCTCGT GCCCGAATAC 
CTGGTGCTCG TGCTGCTGCT CGGCGCGGCG CGCGCATGGC TGTTTCCGCA CATCGGGCCG 
GACATCGGCA ACGGGGTCGG CTGGATCGTC GCGTTCGCGA TCGCCGGCAT GCTGTTCGTG 
ATTCCGACCG CGGGCGAGGT GCCGATCATC CAGGCGATGC TCTCGCTCGG CATGGGCGTT 
GGTCCGGCGG GTGCGCTGCT GATGACGCTG CCGCCCGTCA GCGTGCCGTC GCTCGCGATG 
TTGGCGCGTT CGTTCAAGCC GGCGACGCTC GCGCTCGTCG CGGCGCTCGT CGTCGCGTTC 
GGCGTGGTCG GCGGGCTGGC CGCCGTCGCG CTGGGGTTCT GA

Protein sequence

MSSSRSYTPH PALGLATFVV LAVAGLFYVK WFPYYHKAFA AAEHHSIGQS ILMGAAAHAP 
QPSLQAALDY AWAYGKAIWQ AMVLGLLLGS AVQALLPAHW VARALGGTGF GSVAAGGLLA 
LPGMMCTCCA APVVAGLRER DASPGGALAF WLGNTVLNPA ALVFMGFVLG WHWSALRLVL 
GVAMVFGVGY LVNRLAGAQP RVVDDALRAK LVAEQAAVGN AFVRWMKIFA RMTVRLVPEY 
LVLVLLLGAA RAWLFPHIGP DIGNGVGWIV AFAIAGMLFV IPTAGEVPII QAMLSLGMGV 
GPAGALLMTL PPVSVPSLAM LARSFKPATL ALVAALVVAF GVVGGLAAVA LGF