Gene BURPS668_3422 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3422
Symbol
ID	4883382
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	3347853
End bp	3348926
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	69%
IMG OID	640129350
Product	allantoicase
Protein accession	YP_001060433
Protein GI	284159940
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG4266] Allantoicase
TIGRFAM ID	[TIGR02961] allantoicase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0252136
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGCCG ATTTTTCCGC CGGTTTTCCG CTTTCGGACA CACATTCAAT AACAGGAGAC 
GACATGGCCG CCCCGATTCT CGATCCGAAC GCACCCGCGT TCACGCGCCG CTACATGAAT 
CTCGCCGACC CGCGCCTCGG TGCGAAGGCG CTCTTCGCGA GCGACGAATT CTTCGCGCCG 
AAGGAGCGGA TGCTCGATCC CGAGCCCGCC GTGTTCATTC CCGGCAAGTA CGACGACCAC 
GGCAAATGGA TGGACGGCTG GGAGACGCGC CGCAAGCGCA CGACGGGGCA CGACTTCTGC 
GTCGTGCGGC TCGCGCGGCC GGGCGTGGTG TACGGCGTCG ATCTCGACAC GAGCCACTTC 
ACCGGCAATT TCCCGCCCGC CGCGTCGATC GACGCATGCG TGTCGGACGC CGACACGCCG 
CCCGACGACG CCGTCTGGGA AACGCTCGTG CCGGCGACGA CGCTCGCCGG CAATCAGCAT 
CACTACGTCG ACGTGAGCAA TCCTCGCACC TATACGCACC TGCGCGTGAA CCTGTATCCG 
GACGGCGGGC TCGCGCGGCT GCGCGTGTAC GGCCAGCCGC AGCGCGACTG GAGCCGCGCG 
GCGCGCGGCG AGCTCGTCGA TCTGGCCGCG ATCGAGAACG GCGCGTATCT CGTCGCCGCG 
AACAACGAGC ACTTCGGCCC CGCGTCGCGG ATGCTGATGC CCGGGCGCGG CGCGAACATG 
GGCGACGGCT GGGAGACGCG GCGCCGCCGC GAGCCCGGCA ACGACTGGGC GATCGTCGCG 
CTCGCGCGGC CCGGCGTGAT TCGTAGGGTC GAAGTCGATA CCGCGCACTT CAAGGGCAAT 
TTCCCGGACC GCTGCTCGCT GCAGGCGGCG CGCGTCGCGG GCGGCACGGA CGCGTCGCTC 
GTCACGCAGG CGATGTTCTG GCCGATGCTG CTCGGCGAGC AGCCGCTCGG GATGGATAGC 
GTGCATACGT TCGAGACGCA GCTCGCGGCG CTCGGCCCCG TCTCGCACGT GCGGCTGAAC 
ATCCATCCGG ACGGCGGCGT GTCGCGCCTG CGCCTCTGGG GCGAGCTCGC ATAA

Protein sequence

MAADFSAGFP LSDTHSITGD DMAAPILDPN APAFTRRYMN LADPRLGAKA LFASDEFFAP 
KERMLDPEPA VFIPGKYDDH GKWMDGWETR RKRTTGHDFC VVRLARPGVV YGVDLDTSHF 
TGNFPPAASI DACVSDADTP PDDAVWETLV PATTLAGNQH HYVDVSNPRT YTHLRVNLYP 
DGGLARLRVY GQPQRDWSRA ARGELVDLAA IENGAYLVAA NNEHFGPASR MLMPGRGANM 
GDGWETRRRR EPGNDWAIVA LARPGVIRRV EVDTAHFKGN FPDRCSLQAA RVAGGTDASL 
VTQAMFWPML LGEQPLGMDS VHTFETQLAA LGPVSHVRLN IHPDGGVSRL RLWGELA