Gene BURPS668_2349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_2349
Symbol
ID	4884195
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	2324337
End bp	2325752
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	69%
IMG OID	640128277
Product	hypothetical protein
Protein accession	YP_001059381
Protein GI	126442036
COG category	[S] Function unknown
COG ID	[COG5267] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.475225
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGGCGG CGATGCAGAC CCTGCTCGAC GCGGACGACG CGCGCTTTCT GCTGACGCGC 
ACCGGCTTTT CGCCGCCGCC GCGCGCGCTC GCGCGCTTCG TCGGCATGAC GCGCGCGCAG 
GCGCTCGCCG AACTGCTCGA CGGCGCCCGC ACGCAAAGCG TGACGCCGCC GCCCGACTGG 
GTGCGCGAGC CGCCGCCGTC GCGCGCGATG CGCGCCGCGT TCTCGCCGGA CGAGCGGCGC 
GCGGAACAAC AGCTTCGCAA TCGCCGCTAC GACGAGCTGC GCGCATGGTG GGTGCGCGAG 
ATGATCGTGA CGCCTTCGCC GCTCACCGAG CGCATGACGC TCTTCTGGCA CAACCACTTC 
ACGTCCGGCC AGGACAAGGT ACCGTTTCCG CAAACGATTG CGGCTCAGCA TGCGCTGCTG 
CGCGCCAACG CGCTCGGCAA TTTCGGCGCG ATGCTGCACG GCGTCGCGAA GGATCCGGCG 
ATGCTGCAGT ATCTCGATGG CGCGAGCAAT CGCAAGGGCC GCCCGAACGA GAACTTCGCG 
CGCGAGGCGA TGGAACTTTT CACGCTCGGC GAAGGCCACT ATACGCAGCG CGACGTGTCC 
GAGGCCGCGC GCGCGTACAC CGGCTGGGGG CTCGATCCCG ATGCGCTCAC GTACGTGTTC 
CGGCCGAACG TTCACGACGA CGGCGTGAAG ACCGTGCTCG GCGAAACCGG GCGCTTCGAT 
GGCGACGCGG TGCTCGACAT CCTGCTCGGG CGCCCCGAGA CCGCGCGCTT CGTCGTCGCG 
AAGCTGTGGC GCGAATTCGT CTCCGATGCG CCGGATGCGG GCGAGGTCGA GCGCATCGCC 
GCGCGCTTGC GGCAGAGCGA TTACGACATC CGCGCGGCGC TCACGGAGCT GTTTTCGTCC 
GACGCATTCT GGGCCGAGCG CAACCGCGGC GTGCTCGTCA AGTCGCCGGC GGAATTCGTG 
GTCGGCACGG TGAGGCTGTT CGACGTCGAT TACGTCGATG CCGCGCCGTT CGCGAACACG 
TTGCGCGCGC TGGGTCAGAA CCTGTTCTAT CCGCCGAACG TGAAGGGCTG GCCGGGCGGC 
GTGAGCTGGA TCAACAGCGC GACGCTGCTT GCGCGCAAGC AGTTCGTCGA GCAGATGATG 
CGCGCGACCG AGGCGCCCGG CATGCGTGCG GCGCCCGTTT CCCGCGACAT GGCGGGCCAG 
CCGGCGCCGA CGCGGCGCGG CGCGATGCGC TTCGATCTCG ACGCGTGGCT TGCCGCGTAC 
CGGACGAAGC CGCAGGCGCA GCCGGATCTG TCGACGGAGC TGCAACTGCA GCACGCGGTG 
CTGCCGATTT CGCCGGCCGC GGCGATCGAG GCGGGGGCGA CGAGCGGCGC GTATTTGCAG 
GCCCTGTTGA TGGACCCGGC GTATCAACTG AAGTGA

Protein sequence

MPAAMQTLLD ADDARFLLTR TGFSPPPRAL ARFVGMTRAQ ALAELLDGAR TQSVTPPPDW 
VREPPPSRAM RAAFSPDERR AEQQLRNRRY DELRAWWVRE MIVTPSPLTE RMTLFWHNHF 
TSGQDKVPFP QTIAAQHALL RANALGNFGA MLHGVAKDPA MLQYLDGASN RKGRPNENFA 
REAMELFTLG EGHYTQRDVS EAARAYTGWG LDPDALTYVF RPNVHDDGVK TVLGETGRFD 
GDAVLDILLG RPETARFVVA KLWREFVSDA PDAGEVERIA ARLRQSDYDI RAALTELFSS 
DAFWAERNRG VLVKSPAEFV VGTVRLFDVD YVDAAPFANT LRALGQNLFY PPNVKGWPGG 
VSWINSATLL ARKQFVEQMM RATEAPGMRA APVSRDMAGQ PAPTRRGAMR FDLDAWLAAY 
RTKPQAQPDL STELQLQHAV LPISPAAAIE AGATSGAYLQ ALLMDPAYQL K