Gene BURPS1710b_2245 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_2245
Symbol
ID	3689234
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	+
Start bp	2510791
End bp	2511831
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	69%
IMG OID	637728702
Product	hypothetical protein
Protein accession	YP_333641
Protein GI	76811638
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.260146
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGACCG TTGACGAAGA CGACATCGGC ACGGCGAGCG GCCGCGACGA AGGCGACTGG 
GTGCCCAACC GGTTTTGCTT GCGCAACGCC TGGTTTCCCC TCGCGCATAC CTTCGAAATC 
GGCGAGCGCG CGTCGCGCTG GCAGATCTAC TCGCAGCCGT GCTATCTGTG GCGCGCACGC 
GGGCGCATCC ATGCATCGCG CCGGCATCCG GACCTGCCCG CCGCCCCCGC CATGCCCGCC 
GCGCCGGACT CGCCGTTCGA GCCGCCCGAA CGCTATCCGG TGGTCGAGCG ATTCGGCTAC 
GCATGGATCT GGTACGGCGA CCCGGAGCGC GCGAGCGACG CGCTCGTGCC CGACGTGCCG 
TTCCTGCCGC GCGAAGGGGG GCTGCCCGAG CGCATGCAGG GCAACATCCG GCTCGACTGC 
TGCACGCCGC TGCTCGTCGA GAACCTGCTC GACCTGACGC ACGCGGACTA TCTGCACGCG 
AACCTGCTCG GCGACGAGCA ATCCGAAGAG GATCGCGTCG ACGTGCGGTT CACCTCCGAG 
ACGGTGACGA TGATCCGGCA GTGCACGAAC AAATCGATCG CGCCGATCAT GCGCTGGTTC 
GGCGGCGTGC GCGCGAAGTA TCAGGACGTT CACGTCGTGA TCCACGTGCA TGTGCGCAGC 
TCCGTCGCGG TCGCGTACGG ACGCTACATG CCGGGCATCG ATCTGCCGAT CTTCCACCCG 
TGCGTGCCGG AATCGCGCGA CCGGTGCCGG CTCAGCTTCG CGTTGAACAT GACGCGAACG 
CCGTGGCTGC TGCGCGCGCT GATGCCGCTC ACGCCTTACA TCGTGCTGCC GCAGGACAAT 
CGCATGATCG GCCCGCAAAG CACCCGCTAC CGGGATGCCG GCGAGCGCCG CGATCTGTAT 
TCGCGCTTCG ACCGCGCGGG GCTGCGGTAT CGGCTCCTGC TGCAGCAGCT CGCCCGGCGG 
CAGCGCGACG GCGATTTCTC GTACGCCCCC GATGCGCTGC CCGGCCAGGA CGCGCGCGGC 
ATTCTCGGCA TGCCGGACTA G

Protein sequence

MATVDEDDIG TASGRDEGDW VPNRFCLRNA WFPLAHTFEI GERASRWQIY SQPCYLWRAR 
GRIHASRRHP DLPAAPAMPA APDSPFEPPE RYPVVERFGY AWIWYGDPER ASDALVPDVP 
FLPREGGLPE RMQGNIRLDC CTPLLVENLL DLTHADYLHA NLLGDEQSEE DRVDVRFTSE 
TVTMIRQCTN KSIAPIMRWF GGVRAKYQDV HVVIHVHVRS SVAVAYGRYM PGIDLPIFHP 
CVPESRDRCR LSFALNMTRT PWLLRALMPL TPYIVLPQDN RMIGPQSTRY RDAGERRDLY 
SRFDRAGLRY RLLLQQLARR QRDGDFSYAP DALPGQDARG ILGMPD