Gene BURPS1106A_A1672 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1672
Symbol
ID	4904478
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	1641497
End bp	1642558
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	72%
IMG OID	640144777
Product	putative regulatory protein
Protein accession	YP_001075705
Protein GI	126456840
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACACAG CGCGCATCAA AGCAGCGGCC GCCGATATGC CGGAACGCGC CCGCCTGCGC 
ATCGGCTTCG TCGCGCTGAG CGACGCCGCG CCGCTCGTCG CCGCACAGCG GCTCGAGCTC 
GGCGCACGCT ACGGCTTGAC GCTCGAGCTC TGCCGGCAGC CGTCGTGGGC GAGCATTCGC 
GACAAGCTGC TGTCGGGCGA GCTCGACGCC GCGCACGCGC TGTACGGGCT CGTCTACGGC 
GTGCAGCTCG GCATCGGCGG GCCGCGCGCC GACCTGGCGG TGCCGATGGT GCTGAACCGC 
AACGGCCAGG CGATCACGTT CTCGAACCGG CTCGCCGACG CGTACCGCGC GTCGGGCGAG 
CTGAAGGCCG CGCTCGCGAC ACTCGGCCGG CGCCCCGTGT TCGCGCAGAC GTTCCCGACC 
GGCACGCATG CGATGTGGCT GTATCACTGG CTCGCGTCGC ACGGCGTCGA TCCGCTGCAC 
GATGTCCGCA GCGTCGTGAT TCCGCCGCCG GAGATGGTGG ACGCACTCGC GGCGGGCGAA 
CTCGACGGGC TGTGCGTGGG CGAGCCGTGG AATGCGGTCG CCGAGGCGCG CGGCGCGGGC 
AGGACGGTCG CGGCGACGAG CGAAGTGTGG CCCGACCATC CGGAAAAGGC GCTCGCGTGC 
CGGCGCGAGT TCGTCGCGCT GTATCCGAAT ACGGCGCGCC TGCTGGTGCG CACGCTGCTC 
GATGCGTGCG AATGGCTCGA CGACGCGGAC CACCGAATGA AGGCGGCCGC ATGGCTGGCG 
GAGCCGGACG CGATCGGCGT GCCGATCGGG CAGATCGCGC CGCGGCTGCT CGGCGACTAC 
GGCGCGGGGC CGTTTGCGCA GCCGCCCGCG CCGATCAAGT TCTACGAGCA CGGAACGGTG 
AATCGGCCGG CCGCGAGCGA TGGGATGTGG TTCCTGTCGC AGTATCGGCG CTGGGGGATG 
CTGAGCGGCG ACGTCGACGA TGCGGCGATC GCGAACGGCG TCGCGCACAC GGCGCTCTAC 
GACGAAGCGG TCGCGCTCGG AGGGGCACGA CGCGGCGAGT GA

Protein sequence

MNTARIKAAA ADMPERARLR IGFVALSDAA PLVAAQRLEL GARYGLTLEL CRQPSWASIR 
DKLLSGELDA AHALYGLVYG VQLGIGGPRA DLAVPMVLNR NGQAITFSNR LADAYRASGE 
LKAALATLGR RPVFAQTFPT GTHAMWLYHW LASHGVDPLH DVRSVVIPPP EMVDALAAGE 
LDGLCVGEPW NAVAEARGAG RTVAATSEVW PDHPEKALAC RREFVALYPN TARLLVRTLL 
DACEWLDDAD HRMKAAAWLA EPDAIGVPIG QIAPRLLGDY GAGPFAQPPA PIKFYEHGTV 
NRPAASDGMW FLSQYRRWGM LSGDVDDAAI ANGVAHTALY DEAVALGGAR RGE