Gene BURPS668_2523 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_2523
Symbol
ID	4883472
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	2493468
End bp	2494868
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	72%
IMG OID	640128451
Product	hypothetical protein
Protein accession	YP_001059550
Protein GI	126440109
COG category	[S] Function unknown
COG ID	[COG4529] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACGA CGACGGTTGC GATTATCGGT GCGGGGTTTT GCGGGGCGAC GCTGGCGACG 
CATCTGCTGC GAAGGCCGCC GGTGCGGCCG ATGCGGGTGC TGCTGATCAA CCGGTCGGGC 
GCGATGGCGC GCGGCGTGGC GTACGGCACG CGCGCGCTCG GCCATCTGCT GAACGTGCCC 
GCCGGCCGGA TGAGCGCGGT GGCCGGCGAC GATGACGACT TCTATCGATA CGCGAGCGGG 
CGCGATCCGC GCGTCGCGCG CGGCAGCTTC GTGCCGCGGC GGATCTACGG CGACTACCTC 
GAGGCGCGCC TGACCGAGGC GATCGAGCAG GCGCACGCGG GCATCGAATT TCGTAGCGTG 
GTGGGCAGCG CGGTGAGAAT CGCGCCCGTC GACGGCGGCG CGCGCGGCGC GATCACGATG 
GACGGCGGCG CGGTGATCGA GGCCGACCGC GTCGTGCTGA GCAGCGGCAA CGAAATGCGC 
CGCGATCCGT TCATCGCCGA ATCGCAACGC AAGTTCTACG ACAGCCATAC CTACGTTCGC 
GATCCATGGC GGCCGGGCGC GCTGCGCGGC ATCGCGCCCG ATACGCCGGT GCTGCTCGTG 
GGCAGCGGGC TCACGATGAT GGACGTGGTG CTCGATTTGC GCGCCCGGGG CCACGCGGCG 
CCGATTCACG TGGTGTCGCG CCACGGGTTG ATGCCGCTCG CGCACCGTGA GATGGACGCG 
CCGCCGTCCT ACGACGATCG GCTGGCGGCC CGTATGCTCG CGCGCGCGGA CGTGCGCCAT 
TACGTGCGCG CGGTGCGCGA CGCGATTCGC CGAGGCGGCG ACTGGCGAGA CGTGATCGGT 
TCGCTGCGCG CGGCGACGCC GGCGCTGTGG CGCCAGTTGC CGAGCGACGA GCGCCGGCGC 
TTCCTGCGCC ATGTCAGGCC GTACTGGGAC GTGCATCGCC ACCGCTGCGC GCCCGAGCCG 
GCCGCACGGC TGCAAGCGGA ATTCGAGCGA GGCGGCGTCG CGGCCGTCGC GGGGCGGGTG 
ACGGGCTACA GCGAACATCC GAACGGCGTC GGCGTGACGG TGCGCCGGCG CGGCGCGGCC 
GTCGACGAGC GTCTCGAGGT GGGCGCGGTC GTCAACTGCA CGGGGCCGGC ACCGGACTTC 
AGCGCGCGGG CGGGATCGCT GCTCGGCAAC CTGTATGCGG ACGGGCTGAT CGTGCCGGAT 
GCGATCGGCA TGGGGTTCGA GATCGCCGAC GACGGCGCGG TGCTCGATCG CGACGGCTCG 
CCGTCGGCGT GGCTGCGTTA TGTCGGACCG TTGCTGCAGG CGCGCGATTG GGAGGCGACG 
GCGGTGCCGG AACTGCGGCA GTACGTGCAG CGGCTCGCCG ATACGCTGCT CGCGCCGCGC 
GACGAACGGG CGCTGACCTA G

Protein sequence

MSTTTVAIIG AGFCGATLAT HLLRRPPVRP MRVLLINRSG AMARGVAYGT RALGHLLNVP 
AGRMSAVAGD DDDFYRYASG RDPRVARGSF VPRRIYGDYL EARLTEAIEQ AHAGIEFRSV 
VGSAVRIAPV DGGARGAITM DGGAVIEADR VVLSSGNEMR RDPFIAESQR KFYDSHTYVR 
DPWRPGALRG IAPDTPVLLV GSGLTMMDVV LDLRARGHAA PIHVVSRHGL MPLAHREMDA 
PPSYDDRLAA RMLARADVRH YVRAVRDAIR RGGDWRDVIG SLRAATPALW RQLPSDERRR 
FLRHVRPYWD VHRHRCAPEP AARLQAEFER GGVAAVAGRV TGYSEHPNGV GVTVRRRGAA 
VDERLEVGAV VNCTGPAPDF SARAGSLLGN LYADGLIVPD AIGMGFEIAD DGAVLDRDGS 
PSAWLRYVGP LLQARDWEAT AVPELRQYVQ RLADTLLAPR DERALT