Gene BURPS668_A1640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1640
Symbol
ID	4887467
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	1568614
End bp	1569597
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	58%
IMG OID	640131579
Product	TauD/TfdA family dioxygenase
Protein accession	YP_001062636
Protein GI	126445134
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2175] Probable taurine catabolism dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATTCCG GGCGATATTT TTTTAATGCC TTTAATTCAA TCAGGAATCC GATTTTCGAT 
CGAATATCGA AAATAACGCC GCATTCGGAT TCCGATCGAA GCGCATCGCG TTCAAACATC 
GTCACCACAG GAATTCGCAT GATTTCACGC AAATTGTCCC CTGCGCTCGG CGCAGAGATT 
CGAGGCATCG ATTTTTCTGA ACCGCTGTCG TCGCAAGCGC GCGACGACGT CATCGGTTTG 
TTGTCCGAAC ATCAATTGCT CGTCTTTCCC GGCCAGCGCC TGTCGTGCGA ACAGCAGATC 
GCCGCGTGCG GCGCGTTCGG CGAGCTCGAG CCGCACCCGA TGACGACCAA TACGTCCTCG 
TTCCCGGAAA TGACGATCGT GTCGAACGTG ACGTCGGACG GCAAGCCGGT CGGCTATCCG 
ACGCCGCCGT TCGAGCTGTG GCATTCGGAT CTGTGCTATC TCGAGCACCC GGCGAAAATG 
ACGTTCTTCT ATGCCGAATC CGTGCCCGAC GCGCACGGCG ATACCTGGTT CGCGAACATG 
TTCCGCGCAT ACGAGACGCT GCCCGACGAA CTGAAAGCGG CGATCGACGG CAAGCATGCG 
GTCTTCAGTC TCGACAGCAG CCTCGTGAAG CGATGCAGGA AGATCGGCTT CGATCTCAAT 
ATCGCGGAAG ACGATTTCAA GCCGACCGTC TCGCATCCGG CGGTGCGCAC CCATCCGCAC 
ACGCGCCAAC GCTCGATCTT CGTCAACTGG GCGCACACCG ACCGGATCGA GGGCTATTCG 
CCCGAGGAAA GCGACGAGAT TCTCGATCGT ATCTTCGCGC ACTGCCGCAA CGAGGATTTC 
ATCTACCGTC ATCGCTACGC GAACGAAGAC CTCGTGATCT GGGACAACGC GTCGCTGATC 
CACACCAATT CGCCGAACCC GCCCGTCGGC AATCGCATCA TGCGGCGCGT GATGGTGTCC 
GGGCCGAAGC CGTTCTATCA GTAA

Protein sequence

MYSGRYFFNA FNSIRNPIFD RISKITPHSD SDRSASRSNI VTTGIRMISR KLSPALGAEI 
RGIDFSEPLS SQARDDVIGL LSEHQLLVFP GQRLSCEQQI AACGAFGELE PHPMTTNTSS 
FPEMTIVSNV TSDGKPVGYP TPPFELWHSD LCYLEHPAKM TFFYAESVPD AHGDTWFANM 
FRAYETLPDE LKAAIDGKHA VFSLDSSLVK RCRKIGFDLN IAEDDFKPTV SHPAVRTHPH 
TRQRSIFVNW AHTDRIEGYS PEESDEILDR IFAHCRNEDF IYRHRYANED LVIWDNASLI 
HTNSPNPPVG NRIMRRVMVS GPKPFYQ