Gene BURPS1106A_3343 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3343
Symbol	phnI
ID	4902061
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	3266087
End bp	3267295
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	71%
IMG OID	640136569
Product	phosphonate metabolism protein PhnI
Protein accession	YP_001067580
Protein GI	126453653
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3626] Uncharacterized enzyme of phosphonate metabolism
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.304009
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACGTGG CAGTCAAGGG CGGCGAGCGG GCGATCGAGG CGTCGTGGCG TTTGCTCGAC 
CAAGCGCGGC GCGGCGACCC CGCCGTGCCC GAGCTGAGCG TCGCGCAGAT TCGCGAGCAG 
CAGCGCCTCG CGGTCGCGCG CGTGATGACG GAAGGCTCGC TGTACGACGA GGCGCTGGCG 
GCGCTCGCGA TCAAGCAGGC GGCGGGCGAT CTCGTCGAGG CGATCTTCCT GCTGCGCGCA 
TACCGGACGA CGCTGCCGCG CTTCGGCTAC ACCGCGCCGA TCGATACCGG CGCGATGCGG 
CTCGAGCGAC GGATCTCGGC AACGTTCAAG GACATCCCGG GCGGCCAGTT GCTCGGCCCG 
ACCTACGATT ACACGCAGCG GCTGCTCGAT TTCGCGCTGC TCGCCGAAGG CGACGCAGCG 
CGGCACGAGC CGCACGAGGC CGAATCGGCG CGCGCCGCGG CCGACGCAGG CTCGCCGCCG 
CCGCATGCGA CGCATGCGCC GCCGCCCGCG GCTGCGCGCG TGATCGCGCT CCTGAACGAC 
GAAGGCCTGA TCGAAGAGGA GCGGCCGACG GCGGTCGGCG CCGAGCCGGG CGACCTGTCG 
CGCGAGCCGC TCGCGTTTCC GGCCGATCGC GCGACGCGCC TGCAGAATCT CGCACGCGGC 
GACGAAGGTT TTCTGCTCGC GATGGGCTAC GCGACGCAGC GCGGCTACGG TCATTCGCAT 
CCGTTCGCGG GCGAGCTGCG CTTTGGCGCC GTCGCCGTCG AAATGGCGCT CGACGAGCTC 
GACGGCGAGA CGATCGAGAT CGGCGAGCTC GACGTGACCG AGTGCCAGAT GATCAACCAT 
TTTTCCGGCG GCGACGGCGA GCCGCCTCGC TTCACGCAGG GCTACGGCCT CGCGTTCGGC 
CATTCGGAGC GCAAGGCGAT CGCGATGGCG CTCGTCGATC GCGCGCTGCG CGCGTCCGAG 
CTCGGCGAAG CCGCGCACTC GCCGCCGCAG GATCAGGAGT TCGTGCTGTC GCACAGCGAC 
AACGTCGAGG CGTCCGGCTT CGTCCAACAC CTGAAGCTGC CGCACTACGT CGATTTCCAG 
TCCGAGCTCG AGCTCGTGCG CCGCCTGCGC GCCGGGCATG CGGCGCAGGC GGGAGCGGGC 
GCGAACGCGC ACGAGAACGC GCCCGCCCGC GCCGAACGCG CCGACACGCA CACCGAGGAG 
TCCCGATGA

Protein sequence

MYVAVKGGER AIEASWRLLD QARRGDPAVP ELSVAQIREQ QRLAVARVMT EGSLYDEALA 
ALAIKQAAGD LVEAIFLLRA YRTTLPRFGY TAPIDTGAMR LERRISATFK DIPGGQLLGP 
TYDYTQRLLD FALLAEGDAA RHEPHEAESA RAAADAGSPP PHATHAPPPA AARVIALLND 
EGLIEEERPT AVGAEPGDLS REPLAFPADR ATRLQNLARG DEGFLLAMGY ATQRGYGHSH 
PFAGELRFGA VAVEMALDEL DGETIEIGEL DVTECQMINH FSGGDGEPPR FTQGYGLAFG 
HSERKAIAMA LVDRALRASE LGEAAHSPPQ DQEFVLSHSD NVEASGFVQH LKLPHYVDFQ 
SELELVRRLR AGHAAQAGAG ANAHENAPAR AERADTHTEE SR