Gene BURPS668_A0412 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A0412
Symbol
ID	4888728
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	380788
End bp	382449
Gene Length	1662 bp
Protein Length	553 aa
Translation table	11
GC content	68%
IMG OID	640130353
Product	type I phosphodiesterase / nucleotide pyrophosphatase
Protein accession	YP_001061418
Protein GI	126442340
COG category	[R] General function prediction only
COG ID	[COG1524] Uncharacterized proteins of the AP superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.490012
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGCA ACAGTAAGCA GTTCGAAATC GGCGCATGGC TGGGCGCGTG CGCGCTCGCC 
TTCGCCGGCG CGGCTTCGGC CGCCGCCGTC CAGGATCGCG ATCACGACAG CCGCCCCGTC 
GACGCGAAGC GCGTGCTGCT GGTGAGCATT GATGGTCTGC ACGAGCAGGA CCTCACGCGC 
TGCATCGGCG CGAATACGTG CCCGAATCTC GCGCTGCTCG CGAAATCGGG GGTCACGTAC 
ACGAACGCGC GCACGCCGGG GCTGTCGGAT TCGTTCCCGG GCCTGGCCGC GCTGGTGACG 
GGCGGTTCGC CGAAGAGCGC GGGCCTCTTC TACGACGTGT CGTACGATCG CACGCTGTAC 
GCACCGTCGG ATGCGACGTG CTCGGGCAAG CAAGGCTGGA ACGTCGTGTT CGACGAAACA 
ACCGGCATCG ACGCGATGAA CGGCGGCGCG CTCACGCATC TCGACGGCGG CGGCGCGTTC 
AACCCGCAGG CGATCCCGCA CGCGCGCGTG AACGGCCAGT GCGTGAGCGT CTACCCGCAC 
GACTACGTGA AGACGAACAC GGTGTTCGAA GTCGTCAAGG AACATCTGCG CGGCTCGCAC 
ACCGCATGGG CGGACAAGCA CGCGTGGGGC TACGACTGGG TGAACGGCCC ATCGGGCAAG 
GGCGTCGACG ATCTCGCGCG CACCGAGATC AACTCGATCG ATCCGGCCAC GGGCACCCCC 
TATACCGACA TCTATACGCA TACCGAAAAG TTCGACGACT ATCACGTGCA GGCGATCGTC 
AACCAGATCG ACGGCAAGAA CTCGACGGGC ACCGCGGCCG CGCCCGTGCC GACCCTGTTC 
GGCACGAACT TCCAGACGCT GTCGGTCGCG CAGAAGGCCA CCGTCGCGTC GGGCGGCGGC 
TATCTCGACG CGAGCTTCAC GCCGGGGCCG GAAGTCGCGA ACGCGATCGC GTACGTCGAC 
GGCGCGCTCG GCCGCATCGT CGCCGAGCTC AGGCAGCGCG GGCTGTACGA TTCGACGGTG 
GTGATCGTCA CCGCGAAGCA CGGCCAGTCG CCGACCGACC ATACGAAGCT CGTGAAGCAC 
GGCGACACGC TCACCGCGCT GCTCGAGGCG AACGGCTTCG TCGATCCGAA CGGCAACTTC 
GGCCAGAACA ACACCGCGTC GGGCAACCCG AACGACGGCA CGGGCCTCGT CGGCACGGGC 
TTCGTGCAGA CCGACGACGT CGGCCTCGTC TGGCTGCGCG ACCCGCGCCA GTTGAGCGCG 
GCCGTCGCGA CACTGAAGGC GAATCTCGGC TGCAACGCGC CGGGGATCTG CGCGGACGGC 
CCGCAGGCGT ACATCCTGTA TGGCCCGAGC GTCGCCGAGC GCTTCGGCGA TCCGGCGCTC 
GGCCGCACGC CGGACATCGT CGTGCAGCCG AACCCGGGCG TGATCTACAC GTCGAGCAAG 
AAGAAGGACG AAGAGCACGG CGGCAACGCG CCGGACGACA GCCACCTCGG CCTGCTCGTG 
TCATACGCGG GCTTGCGCCA GGGCCGCACA ATCGACGCGC CGGTGCTGAC GACGCAGGTC 
GCGCCGACGA TCCTGCGCTC GCTCGGCCTC GAGCCGCGCC TGCTGCACGC GGTCGCGCTC 
GAAGGCACGC GCGTGCTGCC GGGCCTTGGC CTCGAGCGCT GA

Protein sequence

MKRNSKQFEI GAWLGACALA FAGAASAAAV QDRDHDSRPV DAKRVLLVSI DGLHEQDLTR 
CIGANTCPNL ALLAKSGVTY TNARTPGLSD SFPGLAALVT GGSPKSAGLF YDVSYDRTLY 
APSDATCSGK QGWNVVFDET TGIDAMNGGA LTHLDGGGAF NPQAIPHARV NGQCVSVYPH 
DYVKTNTVFE VVKEHLRGSH TAWADKHAWG YDWVNGPSGK GVDDLARTEI NSIDPATGTP 
YTDIYTHTEK FDDYHVQAIV NQIDGKNSTG TAAAPVPTLF GTNFQTLSVA QKATVASGGG 
YLDASFTPGP EVANAIAYVD GALGRIVAEL RQRGLYDSTV VIVTAKHGQS PTDHTKLVKH 
GDTLTALLEA NGFVDPNGNF GQNNTASGNP NDGTGLVGTG FVQTDDVGLV WLRDPRQLSA 
AVATLKANLG CNAPGICADG PQAYILYGPS VAERFGDPAL GRTPDIVVQP NPGVIYTSSK 
KKDEEHGGNA PDDSHLGLLV SYAGLRQGRT IDAPVLTTQV APTILRSLGL EPRLLHAVAL 
EGTRVLPGLG LER