Gene BURPS668_2386 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_2386
Symbol
ID	4883071
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	2354923
End bp	2356077
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	68%
IMG OID	640128314
Product	allantoicase
Protein accession	YP_001059418
Protein GI	284159964
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG4266] Allantoicase
TIGRFAM ID	[TIGR02961] allantoicase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCGGCG CGGCGGGTTC GCCGCGACGG CATCCGCTGC GGCGCGCCAG ACGCGCCGCC 
TCGGTCGCCC GAGCCGCGCG AGACGGCGCG CGGCGGCGTT CCACTCATCA GGCATCACGC 
ACTTACGACA AGGACAAGAC GATGGCTCTT CCGCTTTCGG ATCCGAACGC TCCCGAATTC 
ACGCGGCGTT ACGTGAATCT CGCCGATCCG CGTCTCGGCG CGCAGGCGCT TGAGGCGAGC 
GACGATTTCT TCGCGCCGAA GGAGCGCATG CTGAATCCGG AGCCCGCGGT GTTCATCCCG 
GGCAAATACG ACGATCACGG CAAATGGATG GACGGCTGGG AGACGCGCCG CAAGCGCACG 
ACGGGTTATG ACTGGTGCGT CGTGAAGCTC GCGCGTCCGG GCGTGATCAA GGGTGTCGAC 
ATCGATACGA GCCATTTCAC CGGCAATTTC CCGCCCGCCG CGTCGATCGA GGCCGCGCAC 
GTGCCCGACG GCGCGCCGAA CGAGGCGACG AAGTGGGTGG AGATCGTGCC GGCGACGACG 
CTGCAGGGCA ACAGCCATCA CTACGTCGAA GCACGCGACG CGAACGCATA CACGCATCTG 
CGCGTGAACC TCTACCCGGA CGGCGGCATC GCGCGGCTGC GCGTCTACGG CCAGCCGCAG 
CTCGATTGGG CGGGCGCGAG CCGATCGGCG CTGTTCGATC TCGCGGCGAT GGAGAACGGC 
GGCTACGTCG TCGCGGCGAA CAACCAGCAC TTCGGCCTCG CGTCGAACGT GCTGCTGCCG 
GGCCGCGGCG TGAACATGGG CGACGGCTGG GAGACGCGCC GCCGCCGCGA GCCGGGCAAC 
GACTGGGCGA TCGTCGCGCT CGCGCAGCCG GGCGTGATCC GCAAGGTCGA AATCGACACC 
GCGCATTTCA AGGGCAACTA TCCGGACCGC TGTTCGATCC AGGCCGCCTA TGTGCAGGGC 
GGCACCGACA GCTCGCTCGT CACGCAGGCG ATGTTCTGGC CGGTGCTGCT CGGCGAGCAG 
AAGCTGCAGA TGGACAAGCA GCACGCTTTC GAAGCCGAGC TCGCCGCGCT CGGGCCCGTC 
ACGCACGTGC GGCTGAACAT CATTCCGGAC GGCGGCGTAT CGCGTCTGCG CGTATGGGGC 
ACGCTCGACA AATGA

Protein sequence

MRGAAGSPRR HPLRRARRAA SVARAARDGA RRRSTHQASR TYDKDKTMAL PLSDPNAPEF 
TRRYVNLADP RLGAQALEAS DDFFAPKERM LNPEPAVFIP GKYDDHGKWM DGWETRRKRT 
TGYDWCVVKL ARPGVIKGVD IDTSHFTGNF PPAASIEAAH VPDGAPNEAT KWVEIVPATT 
LQGNSHHYVE ARDANAYTHL RVNLYPDGGI ARLRVYGQPQ LDWAGASRSA LFDLAAMENG 
GYVVAANNQH FGLASNVLLP GRGVNMGDGW ETRRRREPGN DWAIVALAQP GVIRKVEIDT 
AHFKGNYPDR CSIQAAYVQG GTDSSLVTQA MFWPVLLGEQ KLQMDKQHAF EAELAALGPV 
THVRLNIIPD GGVSRLRVWG TLDK