Gene BURPS668_1083 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1083
Symbol
ID	4885255
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	1060201
End bp	1061526
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	70%
IMG OID	640127011
Product	hypothetical protein
Protein accession	YP_001058133
Protein GI	126441297
COG category	[S] Function unknown
COG ID	[COG3146] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGGCGAGT GCGATACGGG TCTTCATCAC GGGATCAGCG CGGCCTCCTC GGGCCACGGC 
GCGAACGGCT TTGGCAAACG CACGGGCGGC GCGGCAGCGC GCGCAGCCGG CCGTGCAGAC 
GGGTACGAAC GAAACGGATT CGAATCGTTG AAACACGAAC GTCGCGATTA TCGCATGGGC 
ATCCTCACGT CTGTCCTCGA CGCAAGCGCC GCCGAGTGGG ACGCGCTCGT CGCGCGCGCG 
CCGCGCCCGA CGCCCTTCCT GAAGCATGCG TTCCTGAGCG CGCTGCACCG CGCCGGCTGC 
GCGACCGACG GCACCGGCTG GACGCCGCGC TTCGTCACGC TCGCGGACAG TGCGACGGAC 
GCGCTCGTCG CGGCCGCGCC CGTCTATGCG AAGCGCCATT CGTATGGCGA ATACGTGTTC 
GACTGGGCGT GGGCGGACGC GTACCAGCGC AACGGGCTGC CGTACTACCC GAAGCTGCTG 
TGCGCGGTGC CGTTCACGCC CGTGCAGGGC AGCCGGCTCC TCGCCGTCGA CGACGACGCG 
CGCCGCCGGC TCGCCGCGAC GCTCGTCGCG CTCGCCGAGC AGAGCGACGT GTCGTCGCTG 
CACGTGCTGT TTCCGACGGG CGACGAGGCG CGCGCGCTCG CCGACATGGG GATGATGCTG 
CGCGAGGGCG TGCAATTCCA CTGGCTGAAC GACGGCTACC GCGACTTCGA CGCGTTCCTC 
GGCACGCTCG AGCAGAAGAA GCGCAAGAAC ATCCGCGCGG AGCGCCGCAA GGTCGCGGAC 
GCGGGCGTCA CGCTGCGCCG CGTGCGCGGC GAGGACGCGA CCGACGCCGA TTGGCGCTTC 
TTCGCGCGCT GCTACCGGCA GACGTACCGC GAGCACTTCT CGAGCCCGTA TCTGAATCTC 
GAATTCTTCC GCGAGATCGG CGCGACGATG CCGGAGAACC TGCTGCTCGT GATCGCCGAG 
CGCGACGGGC GGCCGATCGC GAGCGCGCTC GCCGTCTACC AGCGCGGCGA GGCGGGCGGC 
GGCACGCTGT ACGGCCGCTA CTGGGGCGCG CTCGAACACG TGCCGTGCCT GCACTTCGAG 
ACCGCGTACT ACCAGTTGCT CGAATTCTGC ATCGAAGAGC GGCTCGACAC GTTCGAAGGC 
GGCGCGCAGG GCGAGCACAA GCTCGCACGC GGCTTCATGC CGACCGTCAC GCATTCGGCG 
CACTGGCTCG CGCATCCGGC GTTCGCCGAC GCGGTCGGGC ACTTCCTCGC GCAGGAGACG 
AACCAGATTC ACGCGTACGT CGACGAGCTG CGCGAGCACA ATCCGTTCAG GGCCGGCGAG 
CGCTGA

Protein sequence

MGECDTGLHH GISAASSGHG ANGFGKRTGG AAARAAGRAD GYERNGFESL KHERRDYRMG 
ILTSVLDASA AEWDALVARA PRPTPFLKHA FLSALHRAGC ATDGTGWTPR FVTLADSATD 
ALVAAAPVYA KRHSYGEYVF DWAWADAYQR NGLPYYPKLL CAVPFTPVQG SRLLAVDDDA 
RRRLAATLVA LAEQSDVSSL HVLFPTGDEA RALADMGMML REGVQFHWLN DGYRDFDAFL 
GTLEQKKRKN IRAERRKVAD AGVTLRRVRG EDATDADWRF FARCYRQTYR EHFSSPYLNL 
EFFREIGATM PENLLLVIAE RDGRPIASAL AVYQRGEAGG GTLYGRYWGA LEHVPCLHFE 
TAYYQLLEFC IEERLDTFEG GAQGEHKLAR GFMPTVTHSA HWLAHPAFAD AVGHFLAQET 
NQIHAYVDEL REHNPFRAGE R