Gene BURPS1106A_A1032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1032
Symbol	codB
ID	4904063
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	998084
End bp	999409
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	67%
IMG OID	640144138
Product	cytosine permease
Protein accession	YP_001075068
Protein GI	126457523
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1457] Purine-cytosine permease and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGCGGC TTTATTGGCC GGGCATCATC CGTTCACGCT GGAATGCTGG AGATCAAAAG 
ACGATGGCAA CACGGGGCGA ATTTTCATTG AGCGAGGTGC CCGCGCACGA GCGCAAAGGC 
GCACTGTCGA TCACGATGGT GCTGCTCAGC TTCACGTTCT TCACGGGTAC GATGTTCGCG 
GGCGGCAAGA TCGGCGTCGC GTTTCGCGTC GTCGACATGC TGTGGGTCGC GGTCGTCGGC 
AATCTGCTGC TTGCCGCCTA TGCGGCCGCG CTCGCGTTCG TCGCGTCGCG CAGCGGGCTC 
AATTCGGTGC TGATGGGGCG TTTCTGTTTC GGCGAGGTCG GCAGCAAGCT GTCCGATTTC 
CTGCTCGGCT TCGCCGAACT CGGCTGGTAT GCGTGGGGCA CCGCGACGGT GGCGATCGTG 
CTCGTCAAGC TGCTCGGCTG GCCCGCGTCG GTGACGACGC CGCTGATGGT GCTGTTCGGG 
TTCGGCTTCT CGATTACCGC GATCGTCGGC TATCGCGGGA TGGACGCGCT CTCGCGCGTG 
TCGGTGCCGC TGATGTTCGC GCTGCTCGTC GTGTCGATGT GGATCGCCAC GCGCGACGTC 
GGCGGCTGGC CGGGCATCGC GAAGATCGCG CCGACGCAGC CGATGAGCTT CGCCGCCGCG 
GTCACGATGG TGTTCGGCAC GTTCGCGAGC GGCGCGACGC AGGCGACGAA CTGGACGCGG 
CTCGCGAAGA GCGGCCGCGC GGCCGTCGCG GCGAGCATGA TCGGCTTTTT CGTCGGCAAT 
GGGCTGATGA TCGTCGCGGG CGCGTATTGC GCGATCGTCT ATCAGCAGTC CGACATCGTC 
GAAGTGATGA TGCTGCAAGG GCTGTCGATC GCGGCCGTCG TGATGCTCTG CCTGAACCTG 
TGGACGATTC AGGGGCCGAC GATCTACAAC GTGTCGGCGG CCGCGTGCCA TCTGTTGCGC 
AGCGAACGCC GCCGCACGCT GACGCTCGTC GGCGCGGCGG TCGGCATCGT GCTCGCGATC 
GGCGGCATGT ACGAGATGCT GATCCCGTTC CTGATCCTGC TCGGCTCGAT CATTCCGCCC 
GTCGGCGGCG TGATTCTCGC CGATTTCTGG TATCGGCACC GCGGCCGCTA TCCGGCGATC 
GCGAGCGCCC GGCTGCCGCG CTTCAATATC GCCGGGCTCG CCGCATATGC GATCGGCGCG 
GCGCTCGCGT ACGCATCGCC GTGGATCGCG CCGCTCGTCG GCATCGCCGC GTCGTCGTTC 
TGCTACATCG TGTTCGTGCA GATCGCGGGC CGCGCGGTGC GCGCGCCGTC GGTCCAGGGA 
GAGTGA

Protein sequence

MRRLYWPGII RSRWNAGDQK TMATRGEFSL SEVPAHERKG ALSITMVLLS FTFFTGTMFA 
GGKIGVAFRV VDMLWVAVVG NLLLAAYAAA LAFVASRSGL NSVLMGRFCF GEVGSKLSDF 
LLGFAELGWY AWGTATVAIV LVKLLGWPAS VTTPLMVLFG FGFSITAIVG YRGMDALSRV 
SVPLMFALLV VSMWIATRDV GGWPGIAKIA PTQPMSFAAA VTMVFGTFAS GATQATNWTR 
LAKSGRAAVA ASMIGFFVGN GLMIVAGAYC AIVYQQSDIV EVMMLQGLSI AAVVMLCLNL 
WTIQGPTIYN VSAAACHLLR SERRRTLTLV GAAVGIVLAI GGMYEMLIPF LILLGSIIPP 
VGGVILADFW YRHRGRYPAI ASARLPRFNI AGLAAYAIGA ALAYASPWIA PLVGIAASSF 
CYIVFVQIAG RAVRAPSVQG E