Gene BURPS1710b_A0070 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A0070
Symbol
ID	3694387
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	+
Start bp	92684
End bp	93832
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	69%
IMG OID	637730324
Product	putative gamma-butyrobetaine,2-oxoglutarate dioxygenase
Protein accession	YP_335229
Protein GI	76818031
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2175] Probable taurine catabolism dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0635753
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGACAT CGCATTCCGA TCATCTGCAG ATCGACTGGG AAACCGGCCG ATCGAGCCGC 
TATCACTGGG TATGGCTGCG CCAGGCTTGC GAGTGCGCGG ACTGCTTCAA CGCCCATTGC 
CGGCAGCGCC GCTTCGATCC GGCCGCGATC GCGCCCGGCA TCCGGCCCGA GCGCGTGTTG 
CTCGACGCGC ACGGGGTGCG CATCGTCTGG CAGGACGCGC ACGTGAGCAC GTACGCGCTC 
GAGCGGCTCG CGCGCGACGA CTACCGCGAG GCGATTCCCC CCGCCGCGGC GGCGGGCTGG 
ACGCCGTGGC CCGAGCGCGG CGCGCCGTCG GCGAGCCATT TCGCGATCGG CGACGTGCTG 
GACAGCGACG CCGCGCTGCG GCGCGCGCTG AACCAACTGT TCGAATCGGG CCTCGTCGTG 
CTGAAGGCGG GCGACGGCGC GGCGCCGCCT TTCGACGCGG TTCGCGAGCG GCTCGCGGGC 
TTTCTCGAGC CGTCGTATTT CGGCGACTTC TTCGATCTCG AAGTCAAGGC GGACGACGCG 
ACCGACAGCG TATCGTTCAG CACGAGCGCG CTGCCGCTGC ACACCGACAT TCCGTACTGT 
TCGCCGCCGC CCGACTACCA GTTCCTGTAC GGCCTCGACG TCGATCCGCG TTGCGCGCGC 
GAGCAAGTGG GCTGCACGCG CTTCGTCGAC GGCTGGGCGG TGCTGCGCGA ATTGCGCGAC 
GCGTCGCCGG AGATGTTCGA GCGCCTCGCG CGCACGCGCG TCGTCTACCG CGCCGACTAT 
CCGGGCGCGC GCAAGCGCTA CGAGCATCGA ACGCCGATCG TCAGGCTGCG GGCGGACGGC 
ACGGTCGAGC GGCTCATCAA CAATCCGACG AAGATGTTCT TCGACGGCAT CGGCTTCGAC 
GAACTGATGC CGTTCTTTCG CGCGTACCAC GCGTTCAAGG CGCGCCTCGT CGCGACGATG 
CGCTCGTATC TGCATGCATG GACGCAGGGC GACATGGTCG TCTGGGACAA CCGGCGGATC 
TTTCACGGAC GAGGCGATTT CGGCGCGCCC GGCATCGTTC GCACGCTGCG CGGCGGGTAC 
TTCAGGGAAG GCGAACTGCG CGCGCGCGAC GCGTTTCTCG CCGCGGCCGG CGAACGCGCA 
GCGGGTTGA

Protein sequence

MLTSHSDHLQ IDWETGRSSR YHWVWLRQAC ECADCFNAHC RQRRFDPAAI APGIRPERVL 
LDAHGVRIVW QDAHVSTYAL ERLARDDYRE AIPPAAAAGW TPWPERGAPS ASHFAIGDVL 
DSDAALRRAL NQLFESGLVV LKAGDGAAPP FDAVRERLAG FLEPSYFGDF FDLEVKADDA 
TDSVSFSTSA LPLHTDIPYC SPPPDYQFLY GLDVDPRCAR EQVGCTRFVD GWAVLRELRD 
ASPEMFERLA RTRVVYRADY PGARKRYEHR TPIVRLRADG TVERLINNPT KMFFDGIGFD 
ELMPFFRAYH AFKARLVATM RSYLHAWTQG DMVVWDNRRI FHGRGDFGAP GIVRTLRGGY 
FREGELRARD AFLAAAGERA AG