Gene BURPS1710b_A2333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A2333
Symbol	codB
ID	3692805
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	+
Start bp	2837413
End bp	2838675
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	67%
IMG OID	637732587
Product	cytosine permease
Protein accession	YP_337484
Protein GI	162210108
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1457] Purine-cytosine permease and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACAC AGGGCGAATT TTCATTGAGC GAGGTGCCCG CGCACGAGCG CAAAGGCGCA 
CTGTCGATCA CGATGGTGCT GCTCAGCTTC ACGTTCTTCA CGGGTACGAT GTTCGCGGGC 
GGCAAGATCG GCGTCGCGTT TCGCGTCGTC GACACGCTGT GGGTCGCGGT CGTCGGCAAT 
CTGCTGCTTG CCGCCTATGC GGCCGCGCTC GCGTTCGTCG CGTCGCGCAG CGGGCTCAAT 
TCGGTGCTGA TGGGGCGTTT CTGTTTCGGC GAGGTCGGCA GCAAGCTGTC CGATTTCCTG 
CTCGGCTTCG CCGAACTCGG CTGGTATGCG TGGGGCACCG CGACGGTGGC GATCGTGCTC 
GTCAAGCTGC TCGGCTGGCC CGCGTCGGTG ACGACGCCGC TGATGGTGCT GTTCGGGTTC 
GGCTTCTCGA TTACCGCGAT CGTCGGCTAT CGCGGGATGG ACGCGCTCTC GCGCGTGTCG 
GTGCCGCTGA TGTTCGCGCT GCTCGTCGTG TCGATGTGGA TCGCCACGCG CGACGTCGGC 
GGCTGGCCGG GCCTCGCGAA GATCGCGCCG ACGCAGCCGA TGAGCTTCGC CGCCGCGGTC 
ACGATGGTGT TCGGCACGTT CGCGAGCGGC GCGACGCAGG CGACGAACTG GACGCGGCTC 
GCGAAGAGCG GCCGCGCGGC CGTCGTGGCG AGCATGATCG GCTTTTTCGT CGGCAATGGG 
CTGATGATCG TCGCGGGCGC GTATTGCGCG ATCGTCTATC AGCAGTCCGA CATCGTCGAA 
GTGATGATGC TGCAAGGGCT GTCGATCGCG GCCGTCGTGA TGCTCTGCCT GAACCTGTGG 
ACGATTCAGG GGCCGACGAT CTACAACGTG TCGGCGGCCG CGTGCCATCT GTTGCGCAGC 
GAACGCCGCC GCACGCTGAC GCTCGTCGGC GCGGCGGTCG GCATCGTGCT CGCGATCGGC 
GGCATGTACG AGATGCTGAT CCCGTTCCTG ATCCTGCTCG GCTCGATCAT TCCGCCCGTC 
GGCGGCGTGA TTCTCGCCGA TTTCTGGTAT CGGCACCGCG GCCGCTATCC GGCGATCGCG 
AGCGCCCGGC TGCCGCGCTT CAATATCGCC GGGCTCGCCG CATATGCGAT CGGCGCGGCG 
CTCGCGTACG CATCGCCGTG GATCGCGCCG CTCGTCGGCA TCGCCGCGTC GTCGTTCTGC 
TACATCGTGT TCGTGCAGAT CGCGGGCCGC GCGGTGCGCG CGCCGTCGGT CCAGGGAGAG 
TGA

Protein sequence

MATQGEFSLS EVPAHERKGA LSITMVLLSF TFFTGTMFAG GKIGVAFRVV DTLWVAVVGN 
LLLAAYAAAL AFVASRSGLN SVLMGRFCFG EVGSKLSDFL LGFAELGWYA WGTATVAIVL 
VKLLGWPASV TTPLMVLFGF GFSITAIVGY RGMDALSRVS VPLMFALLVV SMWIATRDVG 
GWPGLAKIAP TQPMSFAAAV TMVFGTFASG ATQATNWTRL AKSGRAAVVA SMIGFFVGNG 
LMIVAGAYCA IVYQQSDIVE VMMLQGLSIA AVVMLCLNLW TIQGPTIYNV SAAACHLLRS 
ERRRTLTLVG AAVGIVLAIG GMYEMLIPFL ILLGSIIPPV GGVILADFWY RHRGRYPAIA 
SARLPRFNIA GLAAYAIGAA LAYASPWIAP LVGIAASSFC YIVFVQIAGR AVRAPSVQGE