Gene BURPS1106A_A1376 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1376
Symbol
ID	4905853
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	1295949
End bp	1297508
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	68%
IMG OID	640144482
Product	AraC family transcriptional regulator
Protein accession	YP_001075411
Protein GI	126456594
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.510979
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTTGTG ATTTCTATTT CCCGTTGATC GCCACGCTCG CCTCCGCGCT CGCGCCGCCC 
GGGCTGCGCG CGAAAATCCG CGAGGCGAGA GTCCTCTCCG CGTCCGCCGA CCTCGCGCGT 
CTCACGCAGG ACGGTTGCGG CGACGCGGAG CGAGCGTACC GGATCCAGCT GCACGCCGAC 
ATGCAGCTCG CGATGGCGCT CGAATTCGAT GCCGAGGAAT CGTATAGAAG GTCACGCAAG 
CTGATGCATG CGCCGAAGGA CGAGATCCGT CTGCTGTCGT TTCGCAACAC CGGGTGGCAG 
GCGCTGTTCC GGCGCCGGCT CGGCACCGCG ATGGCCTGCT TCGCGAACGT GACCAGCGAG 
CCCGCCGTCG ATCCCTGCCG CCGCATCGAG GGGCTGTTCG GGACGATGTG CGTGTGGTTC 
GAGCTCGGCC ATCTCGACGA GGCCGGCTAC CTGCTCGACG ACATCGAGCT CGCGATCGAG 
CGCCTGCTCG CCTCGCACGA GGATTTCGCG CTGTGGCGCG AGCTCGCGCA GACGATGCGC 
GCGGATCTGG ATCTGCAAAG ACTCGTGCGG CATGCACCGG AGCTCTCCGA TCACGTGTAC 
TGGCAGTCGG CGCGCCTGAG CGATCCGGTC CGCCCGCCCG TTGAGCGCGA GCGGCTCGCG 
AGCCGCCCGA TCGCCGAACA GGACGTGCGC TCGCCGCTGC TGCGCGCGCG CCTCGATTTC 
AGGACCGCGC TGCGCCGCCT CGCCGGCGGG CAAGCCGACG CGCTCAACGA TCTGATGGCG 
CATCTCGACT GGGCCGACGC GAACGGCCTG ACGTCCTATC AGAACTCGGC CCGGCAGGAA 
ATCGCGCTCG CCGGCCTGAT CGGCAACGCG CCGCATATCG CGGAGATGGT GCTCGCGCCG 
CTCGCGAACG AAATCCGCGT CGGGCACCAT CACGGTCATC TCGAGATCCT GTACTGCCTC 
GCGAAGGTGA ATCAGGCGCA GGGCCGAACC CACCATTCGC AACAGCTGTA CAGCCGCTAC 
GCGATGACGG CGGTCCATTG CGCGCGCAAG GGCGCGTGCG ATCTCGCGCG CAACAGCCCG 
CAGGGGCACG CGCCCCACGT CGCGGACGAC ATCAGCGCGC GCCTGCCCGC CAAATACCGC 
CGCGCGTACC ATTTCCTGCT GAGCAACCTC GAACGCAGCG ATCTGGCGAT CGGCGAGATC 
GCGGAAGTCA TCGGCGTGAC GGTTCGCTCG CTGCAGAACA CGTTCAAGGC GAGCCTGGGC 
GCGACGCCGT CGGAGATCAT CCGTCAGGAA CGGATGAAGC GCATCCATCG TGAACTGCAG 
GGCGAGGATG CGCGGTTCGG CCAGCGCGTG CTCGACTCCG GCAACCGCTG GGGCGTGCCG 
AATCGCTCGA CGCTGCTCAA CGCGTACAAG CGGCAGTTCA ACGAGGCGCC TTCGCAGACG 
CTGCACCGCA AGCATCCGTA CAAGCCCGGC GAAGACGTCG CGTCCGGCGT CCTCGCGAGC 
GCCGCGCATC CGGCGGCGGC CAGGCAGCAG CACGAAGCGA GCGTGTCGAC GGCCGACTGA

Protein sequence

MFCDFYFPLI ATLASALAPP GLRAKIREAR VLSASADLAR LTQDGCGDAE RAYRIQLHAD 
MQLAMALEFD AEESYRRSRK LMHAPKDEIR LLSFRNTGWQ ALFRRRLGTA MACFANVTSE 
PAVDPCRRIE GLFGTMCVWF ELGHLDEAGY LLDDIELAIE RLLASHEDFA LWRELAQTMR 
ADLDLQRLVR HAPELSDHVY WQSARLSDPV RPPVERERLA SRPIAEQDVR SPLLRARLDF 
RTALRRLAGG QADALNDLMA HLDWADANGL TSYQNSARQE IALAGLIGNA PHIAEMVLAP 
LANEIRVGHH HGHLEILYCL AKVNQAQGRT HHSQQLYSRY AMTAVHCARK GACDLARNSP 
QGHAPHVADD ISARLPAKYR RAYHFLLSNL ERSDLAIGEI AEVIGVTVRS LQNTFKASLG 
ATPSEIIRQE RMKRIHRELQ GEDARFGQRV LDSGNRWGVP NRSTLLNAYK RQFNEAPSQT 
LHRKHPYKPG EDVASGVLAS AAHPAAARQQ HEASVSTAD