Gene BURPS1106A_1420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1420
Symbol
ID	4900888
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	1393356
End bp	1394372
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	72%
IMG OID	640134650
Product	LacI family transcriptional regulator
Protein accession	YP_001065693
Protein GI	126455315
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCCCA CCATCAAAGA CGTCGCCGCG CTCGCCGGCT TTTCGATCGC CACCGTGTCG 
CGCGCGATCA ACGCGCCGCA CACCGTCCAT CCGGCGACGC TCGAAAAGAT CCGCGCGGCG 
ATCGGCGCGC TGCGCTTTCG CCCGAATCCG CTCGGCCGGC AATTGCGCAG CGACCGCACG 
CAATTGATCG GCGTCGTGCT GCCGACGCTC GCGAATCCCG TGTTCGCCGA ATGCCTGCAG 
GGCGTCGACG AACTCGCGAC GCAGGCCGGC TTCAAGCTGA TCGTGATGTC GACCGAATAC 
GATGCGGCGC GCGAGCGCCA TGCGATCGAG ACACTGCGCG CGCAGCGCGT GGAAGGGCTG 
ATGCTCACCG TCGCCGACGC CGACGCGCAC CCGCTGCTCG ACGAGCTCGA CCGCGACGGC 
CCGCTCTACG TGCTGATGCA CAACGACACG CCGCATCGCC CGTCGGTGGC GGTCGACAAT 
CGCCGCGCCG CGTACGACGG CGTGCGGATG CTGATCGAGC GCGGCCATCG GCGCGTGCTG 
ATGCTCGCGG GCTCGCTCGA CGCATCCGAT CGCGCGCGGC TGCGCGTGCA CGGCTATGCG 
CAGGCACTCG ACGAGCGCGG GCTCGAACCG CTGCCCGCGC TCGAGCTCGA CTTCAATGCA 
CCCGCGCTGC CGCACGCGAT GCTCGCGCAT CTGAGCGCGC GCGCGACGCG CCCCACCGCG 
CTCTTCTGCA GCAACGACTG GCTCGCGATG GTCGTGATTC GCGGGCTGCG CGACGCGCAC 
CTCGCGGTGC CCGACGACAT GTCGGTGCTC GGCTTCGACG GCCTCGCGGT CGGCGAGCTG 
CTCGCGCCGC CGCTCGCGAG CGTCGCGACG CCGAATCGCG AGATCGGCCG CGCCGCGTGG 
CGGCGCCTTG CCGAGCGCAT CGCCGGCAAG CGCCATGCGC AACCCGCGCT GACGCTGCCG 
CACGCGGTGC GCGACGGCGC GACCGTCGCG CCGCCGCGCG ATGCGCGCAT CGCCTGA

Protein sequence

MTPTIKDVAA LAGFSIATVS RAINAPHTVH PATLEKIRAA IGALRFRPNP LGRQLRSDRT 
QLIGVVLPTL ANPVFAECLQ GVDELATQAG FKLIVMSTEY DAARERHAIE TLRAQRVEGL 
MLTVADADAH PLLDELDRDG PLYVLMHNDT PHRPSVAVDN RRAAYDGVRM LIERGHRRVL 
MLAGSLDASD RARLRVHGYA QALDERGLEP LPALELDFNA PALPHAMLAH LSARATRPTA 
LFCSNDWLAM VVIRGLRDAH LAVPDDMSVL GFDGLAVGEL LAPPLASVAT PNREIGRAAW 
RRLAERIAGK RHAQPALTLP HAVRDGATVA PPRDARIA