Gene BURPS1710b_A2001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A2001
Symbol
ID	3694060
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	-
Start bp	2433925
End bp	2435346
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	73%
IMG OID	637732255
Product	GntR family transcriptional regulator
Protein accession	YP_337152
Protein GI	76817606
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.577314
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGTCTG CGTCGCGGAT CGATTGCGAT GCCGCATCGT ATGACCGAGA ATCAATACAA 
TCAAATAATT GTCATGGATA CATCGGCATG GCTCACGCCC GCTACAAGCG CCTCGTCGAC 
ACGCTCGCCG CCGATATCCG CTCGGGCCGC CTGCCGCCCG GCGCGCGCCT GCCGACGCAT 
CGCAAGCTCG CGGCGGCCGA GGGCCTCGCG CTCGTCACGG CGACGCGCGT CTACGCGGAG 
CTCGAGGCAA TGGGGCTCGT GAGCGGCGAG ACCGGCCGCG GCACGTTCGT GCGGGAAACC 
GCGCTGCCGC GCGGGCTCGG CGTCGACCAG CACGCGAGCG CCGCCGGCGT CGTCGATCTC 
GCGTTCAACT ATCCGTCGCT GCCCGAGCAG GCCGAGCTGC TGCGCGGCGC GCTGCGCCAG 
CTTGCGTCGT CGGGCGATCT CGACGCGCTG CTGCGCTACC AGCCGCACGG CGGGCGGTGG 
CACGAGCGCG CGTCGGTCGC CCGCCATCTC GCGCGCCGCG GGCTGTCGGT CGACGCGCAA 
CGCGTCGCGA TCGTCAACGG CGCGCAGCAC GGGCTCGCGG TGACCGCGAT GGCGCTGCTG 
CGGCCGGGCG ACGTCGTCGC CGTCGACGCG CTCACCTACC CCGGCTTCAA GGTCGTCGCC 
GATGCGCAGC ACCTCGAGCT CGCGCCGCTT CCGGCATCCG GCCAGGGCCC CGACCCCGAC 
GCGCTCGAGC GCCTTTGCAG GACGCGGCGC GTGCGCGCGG TGTACACGAT GCCGACGCTG 
CACAATCCGC TCGGCTGGGT GACGAGCGCG CACCGCCGGC GCCGGCTCGT CGCGATCGCG 
CGCCGCCACG GGCTGCTGAT CATCGAGGAC GGCGCGTATG CGTTCCTCGC CGACGATCCG 
CCCGAGCCGA TCGCCGCGCT CGCGCCGGAG GCTACCGTCT ACGTGTCCGG GCTGTCGAAG 
AACGTCGCGA CCGGGCTGCG CGTCGGCTTC GTCGCGGCGC CCGAGCCGTG GGCGCCGGCG 
ATCGAGCGCG CGATTCGGGG CACGACGTGG AACACGCCCG GCGTGATGAC GGCGATCGCC 
TGCGGCTGGC TCGACGACGG AACGGTCGAG CGGCTCGAGG CGGACAAGCG CCGCGACGCC 
GCGGCGCGGC AGGCGATCGC GAGCGAAGCG TTCGCGGGGC TGCGCTGCAT CCGCCATCCG 
GCGTCATATT TCGTGTGGCT GCCGCTCGCC GACGACGCGC GCGCCGACCG GGTCGCGATG 
ACGCTGATGC GCGAGCGGGT GGCGGTGTCG ACCGCCGAGC CGTTCGCGAC GTCCGCGCAC 
GCGCCGCACG CGATCCGCGT CGCGCTCGGG TCCGTCGATC CGCCGACGCT GCGCGACGCG 
CTCGGCAAGG TGCGACGGGC GATCGACGCG CATTCGTATT AG

Protein sequence

MSSASRIDCD AASYDRESIQ SNNCHGYIGM AHARYKRLVD TLAADIRSGR LPPGARLPTH 
RKLAAAEGLA LVTATRVYAE LEAMGLVSGE TGRGTFVRET ALPRGLGVDQ HASAAGVVDL 
AFNYPSLPEQ AELLRGALRQ LASSGDLDAL LRYQPHGGRW HERASVARHL ARRGLSVDAQ 
RVAIVNGAQH GLAVTAMALL RPGDVVAVDA LTYPGFKVVA DAQHLELAPL PASGQGPDPD 
ALERLCRTRR VRAVYTMPTL HNPLGWVTSA HRRRRLVAIA RRHGLLIIED GAYAFLADDP 
PEPIAALAPE ATVYVSGLSK NVATGLRVGF VAAPEPWAPA IERAIRGTTW NTPGVMTAIA 
CGWLDDGTVE RLEADKRRDA AARQAIASEA FAGLRCIRHP ASYFVWLPLA DDARADRVAM 
TLMRERVAVS TAEPFATSAH APHAIRVALG SVDPPTLRDA LGKVRRAIDA HSY