Gene BURPS668_A1569 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1569
Symbol
ID	4885743
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	1500542
End bp	1501690
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	69%
IMG OID	640131508
Product	putative gamma-butyrobetaine,2-oxoglutarate dioxygenase
Protein accession	YP_001062565
Protein GI	126443099
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2175] Probable taurine catabolism dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGACAT CGCATTCCGA TCATCTGCAG ATCGACTGGG AAACCGGCCG ATCGAGCCGC 
TATCACTGGG TATGGCTGCG CCAGGCTTGC GAGTGCGCGG ACTGCTTCAA CGCCCATTGC 
CGGCAGCGCC GCTTCGATCC GGCCGCGATC GCGCCCGGCA TCCGGCCCGA GCGCGTGTTG 
CTCGACGCGC ACGGGGTGCG CATCGTCTGG CAGGACGCGC ACGTGAGCAC GTACGCGCTC 
GAGCGGCTCG CGCGCGACGA CTACCGCGAG GCGATTCCCC CCGCCGCGGC GGCGGGCTGG 
ACGCCGTGGC CCGAGCGCGG CGCGCCGTCG GCGAGCCATT TCGCGATCGG CGACGTGCTG 
GACAGCGACG CCGCGCTGCG GCGCGCGCTG AACCAACTGT TCGAATCGGG CCTCGTCGTG 
CTGAAGGCGG GCGACGGCGC GGCGCCGCCT TTCGACGCGG TTCGCGAGCG GCTCGCGGGC 
TTTCTCGAGC CGTCGTATTT CGGCGACTTC TTCGATCTCG AAGTCAAGGC GGACGACGCG 
ACCGACAGCG TGTCGTTCAG CACGAGCGCG CTGCCGCTGC ACACCGACAT TCCGTACTGT 
TCGCCGCCGC CCGACTACCA GTTCCTGTAC GGCCTCGACG TCGATCCGCG TTGCGCGCGC 
GAGCAAGTGG GCTGCACGCG CTTCGTCGAC GGCTGGGCGG TGCTGCGCGA ATTGCGCGAC 
GCGTCGCCGG AGATGTTCGA GCGCCTCGCG CGCACGCGCG TCGTCTACCG CGCGGACTAT 
CCGGGCGCGC GCAAGCGCTA CGAGCATCGA ACGCCGATCG TCAGGCTGCG GGCGGACGGC 
ACGGTCGAGC GGCTCATCAA CAATCCGACG AAGATGTTCT TCGACGGCAT CGGCTTCGAC 
GAACTGATGC CGTTCTTTCG CGCGTACCAC GCGTTCAAGG CGCGCCTCGT CGCGACGAGG 
CGCGCGTATC TGCATGCATG GACGCAGGGC GACATGGTCG TCTGGGACAA CCGGCGGATC 
TTTCACGGAC GAGGCGATTT CGGCGCGCCC GGCATCGTTC GCACGCTGCG CGGCGGGTAC 
TTCAGGGAAG GCGAACTGCG CGCGCGCGAC GCGTTTCTCG CCGCGGCCGG CGAACGCGCA 
GCGGGTTGA

Protein sequence

MLTSHSDHLQ IDWETGRSSR YHWVWLRQAC ECADCFNAHC RQRRFDPAAI APGIRPERVL 
LDAHGVRIVW QDAHVSTYAL ERLARDDYRE AIPPAAAAGW TPWPERGAPS ASHFAIGDVL 
DSDAALRRAL NQLFESGLVV LKAGDGAAPP FDAVRERLAG FLEPSYFGDF FDLEVKADDA 
TDSVSFSTSA LPLHTDIPYC SPPPDYQFLY GLDVDPRCAR EQVGCTRFVD GWAVLRELRD 
ASPEMFERLA RTRVVYRADY PGARKRYEHR TPIVRLRADG TVERLINNPT KMFFDGIGFD 
ELMPFFRAYH AFKARLVATR RAYLHAWTQG DMVVWDNRRI FHGRGDFGAP GIVRTLRGGY 
FREGELRARD AFLAAAGERA AG