Gene BURPS668_A2642 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A2642
Symbol
ID	4886692
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	2538068
End bp	2539126
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	64%
IMG OID	640132579
Product	hypothetical protein
Protein accession	YP_001063635
Protein GI	126442642
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.00776691
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAGCG GGAACGATCA CCAAAAATTC TTCCACCTGT TGCTTCTCGT CGTCACCGTC 
GGTCTTTGCT GGATATTGAC GCCGTTCTTC GGCGCGATCT TCTGGGGGAC CATTCTCGCG 
ATCCTGTTCC AGCCCGTGCA GCGCTGGCTC GCCGCACGCT TCGGCAAGCG CCGCAATCTC 
GCCGCGCTCG TCACGCTGTC GCTCATCATC CTGATCGTGA TCCTGCCGCT TGCGTTCGTG 
ACCGCGACAC TCGTGCAGGA GATCGCGTAC GCGTATCAGC AGATCAAGAC GATGCAGCCG 
AACATGACGC AGTACTTCCA GGAGTTCATG CACGCGCTGC CGAGCTCCGT GCATCGCGTG 
CTGCACAATT ACGGGCTCAC CGACATCGCC GGCATCCAGA AGAAGCTGAC CGACGGCGCG 
GCCGCGATCA GCCAGTTCGT GGCCGCGCAG GCGCTCAGCA TCGGGCAGAA CACGTTCCAG 
TTCGTCGTGA GCTTCGGCGT GATGCTGTAC CTCGTGTTCT TCCTGTTGCG CGACGGCGGC 
GAGATCGGCC GCCGCGTGCG GCGCGCGCTG CCGCTCGACG AAGAGCACAA GCAGCATCTG 
CTGACGAAGT TCACGACGGT CGTGCGCGCG ACCGTCAAGG GCAACATCGC GGTCGCGGCC 
GTGCAGGGCG CGCTCGGAGG CCTGATCTTC TGGATTCTCG GGATCGAGGG CGTGATTCTG 
TGGGGCGCGC TGATGGCGTT CCTGTCGCTG CTGCCCGCGA TCGGCGCGGG GCTCGTATGG 
GTGCCGGCCG CCGGCTATTT CGCGGTGACC GGGCAAATCT GGAAATGCGT GATTCTCGTC 
GCGTTCTGCG TGGGCGTGAT CGGGCTCGTC GATAACCTGC TGCGGCCGAT CCTCGTCGGC 
AAGGACACGA AGATGCCCGA TTGGGTCGTG CTGATCTCGA CGCTCGGCGG CATGGCGCTG 
TTCGGCATCA ACGGCTTCGT GATCGGCCCG CTCGTCGCCG CGCTGTTCAT GGCGAGCTGG 
GACATCTTCG CGCGCACCGA GCAGACCGAC TGGGAATGA

Protein sequence

MDSGNDHQKF FHLLLLVVTV GLCWILTPFF GAIFWGTILA ILFQPVQRWL AARFGKRRNL 
AALVTLSLII LIVILPLAFV TATLVQEIAY AYQQIKTMQP NMTQYFQEFM HALPSSVHRV 
LHNYGLTDIA GIQKKLTDGA AAISQFVAAQ ALSIGQNTFQ FVVSFGVMLY LVFFLLRDGG 
EIGRRVRRAL PLDEEHKQHL LTKFTTVVRA TVKGNIAVAA VQGALGGLIF WILGIEGVIL 
WGALMAFLSL LPAIGAGLVW VPAAGYFAVT GQIWKCVILV AFCVGVIGLV DNLLRPILVG 
KDTKMPDWVV LISTLGGMAL FGINGFVIGP LVAALFMASW DIFARTEQTD WE