Gene BURPS668_1424 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1424
Symbol
ID	4882382
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	1391125
End bp	1392666
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	74%
IMG OID	640127352
Product	GntR family transcriptional regulator
Protein accession	YP_001058467
Protein GI	126439073
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCAGAC GCGCCCGCAT CATCGAGATT CCGTCGCTCG GCATGCTCGA GCGCACGGCC 
GGCAACCTGA GCCGGCAACT GGCGCAGGCG CTGCGGGACG CCGTTCGCCG CGGCGAGGTG 
ATGCCGGGCG ACGCGCTGCC GTCCACGCGG CTGCTCGCCG CTTCGCTGCG CATCGCGCGC 
GGCACGGTGA TCGACGCCTA CGAGCAGCTG ATTGCGGAAG GGTTTCTGGA GTCGCGCGGC 
GGGGTGGGCA CGCGCGTCGC GCCCGCGCTC GCCGAGCCGC GCGGCGCGCG CCGCCGCGCG 
GCCGCGGCGG CGCGTTCGGC CCTGCCGCCG CCCGCCGCCG AGTATGCGCG CGTCGCGCGC 
GAGTTCGCGC CGTTGCCGCC GGCGCCGTTC GCGATTTCGG TGCCGGCCGG CGCGACGGCG 
CCCGACGACG TGTGGCGCCG CCTCGGCAAC CGCCTGCGGG CGAGGGGGCC CGCCGCGCCG 
GCCGGCTACT CGGATCCGCT CGGCGTGCGG GCGTTGCGCG AGGCGATCGC CGGCTACGTG 
CGCAAGTCGC GCTCCGTGCA TTGCGCGCCC GATCAGATCA TCGTCACGAG CGGCGCGCAG 
CAGGGGCTCT ATCTCGCGTG CCAGGTGCTG CTGGGCGCGC ACGATCGCGC GTGGGTCGAA 
AATCCCGCGT ATCGCGGGCT CACCGCGATT CTCGAATGCA CGGGGCGGCG CGACGCGATG 
GTGCGCGTGC CGGTCGACGC GGAGGGCATC GACGTCGATG CGGGCGTCCG GCTCGCGCGC 
GATGCGCGCG CGGCGTTCGT CACGCCGTCG CATCAATATC CGCTCGGCAT GCCGATGAGC 
ATGGCGCGGC GCGCCGCGCT GCTCGCATGG GCGCGCGCGA GCGGCGCATG GGTGGTCGAG 
GACGATTACG ACAGCGAGCT GCGCTACGAG GGCTATCCGT TTCCGTCGCT GCAGGGGCTC 
GATCCGGCGC GCGTCGTCTA TCTCGGCACG TTCAGCAAGA TCCTGTTTCC GTCGTTGCGG 
CTCGGTTATC TGATCGTGCC GGACGAACTG GTCGACGCGT TGCGCGGCGC GCGCGTGCTG 
ATGGATCGAC ACGCGCCGAC CGCGGACCAG CACGTGCTCG CGGCCTTCAT CGCCGGCGGG 
CATTTCGATC GCCACATTCG CCGCGTGCGA GGCGTGTATG CGGAGCAGCG CGCGCAACTG 
ATCGATACGG TCGGCAGGCT GCTGTCGGGC GATCTCGCGT GGCTGCAGCC GGGCGATCAG 
GGGATGCACG CGGTGCTCTG GCTCGCGGCG GGCGTCGACG ACCTGCGCGT TGCGGCGATG 
GCCGCGCAGG CGGGCGTCGC GGTCCGCCCG GTGTCGCCGA TGTTCGCGCC GGGCACGGCA 
CGCCCGGGCC TCGTGCTCGG CTTCGGCGGC TTCGGCCGCG AGCAGATGGA CGCGGCCGCG 
CGCCGGCTCG CCGAGGTGAT CGCCGCGGCG AGCGGCTCGG CGGTGCCGCG TGCCGGGGCC 
GGGCGTCGGC GTCGGGATGG CGCCGGCGGA ACCGACGCGT GA

Protein sequence

MARRARIIEI PSLGMLERTA GNLSRQLAQA LRDAVRRGEV MPGDALPSTR LLAASLRIAR 
GTVIDAYEQL IAEGFLESRG GVGTRVAPAL AEPRGARRRA AAAARSALPP PAAEYARVAR 
EFAPLPPAPF AISVPAGATA PDDVWRRLGN RLRARGPAAP AGYSDPLGVR ALREAIAGYV 
RKSRSVHCAP DQIIVTSGAQ QGLYLACQVL LGAHDRAWVE NPAYRGLTAI LECTGRRDAM 
VRVPVDAEGI DVDAGVRLAR DARAAFVTPS HQYPLGMPMS MARRAALLAW ARASGAWVVE 
DDYDSELRYE GYPFPSLQGL DPARVVYLGT FSKILFPSLR LGYLIVPDEL VDALRGARVL 
MDRHAPTADQ HVLAAFIAGG HFDRHIRRVR GVYAEQRAQL IDTVGRLLSG DLAWLQPGDQ 
GMHAVLWLAA GVDDLRVAAM AAQAGVAVRP VSPMFAPGTA RPGLVLGFGG FGREQMDAAA 
RRLAEVIAAA SGSAVPRAGA GRRRRDGAGG TDA