Gene BURPS1106A_A1481 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1481
Symbol
ID	4906195
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	1435517
End bp	1436665
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	69%
IMG OID	640144587
Product	putative gamma-butyrobetaine,2-oxoglutarate dioxygenase
Protein accession	YP_001075515
Protein GI	126455863
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2175] Probable taurine catabolism dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.758903
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGACAT CGCATTCCGA TCATCTGCAG ATCGACTGGG AAACCGGCCG ATCGAGCCGC 
TATCACTGGG TATGGCTGCG CCAGGCTTGC GAGTGCGCGG ACTGCTTCAA CGCCCATTGC 
CGGCAGCGCC GCTTCGATCC GGCCGCGATC GCGCCCGGCA TCCGGCCCGA GCGCGTGTTG 
CTCGACGCGC ACGGGGTGCG CATCGTCTGG CAGGACGCGC ATGTGAGCAC GTACGCGCTC 
GAGCGGCTCG CGCGCGACGA CTACCGCGAG GCGATTCCCC CCGTCGCGGC GGCGGGCTGG 
ACGCCGTGGC CCGAGCGCGG CGCGCCGTCG GCGAGCCATT TCGCGATCGG CGACGTGCTG 
GACAGCGACG CCGCGCTGCG GCGCGCGCTG AATCAACTGT TCGAATCGGG CCTCGTCGTG 
CTGAAGGCGG GCGACGGCGC GGCGCCGCCT TTCGACGCGG TTCGCGAGCG GCTCGCGGGC 
TTTCTCGAGC CGTCGTATTT CGGCGACTTC TTCGATCTCG AAGTCAAGGC GGACGACGCG 
ACCGACAGCG TATCGTTCAG CACGAGCGCG CTGCCGCTGC ACACCGACAT TCCGTACTGT 
TCGCCGCCGC CCGACTACCA GTTCCTGTAC GGCCTCGACG TCGATCCGCG TTGCGCGCGC 
GAGCAAGTGG GCTGCACGCG CTTCGTCGAC GGCTGGGCGG TGCTGCGCGA ATTGCGCGAC 
GCGTCGCCGG AGATGTTCGA GCGCCTCGCG CGCACGCGCG TCGTCTACCG CGCCGACTAT 
CCGGGCGCGC GCAAGCGCTA CGAGCATCGA ACGCCGATCG TCAGGCTGCG GGCGGACGGC 
ACGGTCGAGC GGCTCATCAA CAATCCGACG AAGATGTTCT TCGACGGCAT CGGCTTCGAC 
GAACTGATGC CGTTCTTTCG CGCGTACCAC GCGTTCAAGG CGCGCCTCGT CGCGACGATG 
CGCTCGTATC TGCATGCATG GACGCAGGGC GACATGGTCG TCTGGGACAA CCGGCGGATC 
TTTCACGGAC GAGGCGATTT CGGCGCGCCC GGCATCGTTC GCACGCTGCG CGGCGGGTAC 
TTCAGGGAAG GCGAACTGCG CGCGCGCGAC GCGTTTCTCG CCGCGGCCGG CGAACGCGCA 
GCGGGTTGA

Protein sequence

MLTSHSDHLQ IDWETGRSSR YHWVWLRQAC ECADCFNAHC RQRRFDPAAI APGIRPERVL 
LDAHGVRIVW QDAHVSTYAL ERLARDDYRE AIPPVAAAGW TPWPERGAPS ASHFAIGDVL 
DSDAALRRAL NQLFESGLVV LKAGDGAAPP FDAVRERLAG FLEPSYFGDF FDLEVKADDA 
TDSVSFSTSA LPLHTDIPYC SPPPDYQFLY GLDVDPRCAR EQVGCTRFVD GWAVLRELRD 
ASPEMFERLA RTRVVYRADY PGARKRYEHR TPIVRLRADG TVERLINNPT KMFFDGIGFD 
ELMPFFRAYH AFKARLVATM RSYLHAWTQG DMVVWDNRRI FHGRGDFGAP GIVRTLRGGY 
FREGELRARD AFLAAAGERA AG