Gene BURPS1106A_A2230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2230
Symbol
ID	4905850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	2216503
End bp	2217681
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	68%
IMG OID	640145335
Product	hypothetical protein
Protein accession	YP_001076263
Protein GI	126456473
COG category	[S] Function unknown
COG ID	[COG3287] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGGGA GATCTGTCGT GACCATGTTG TCTTCCACGA TTCCCGCCGT GCACTCGACG 
TGCGCGCACG CGCGCGACGC CGTGCGGGAA GTGCATGCTG CGCTCGCGAA CTGCGACGCC 
GAACTGGTGT TGTTCTTCTG CTCGAGCCGC TTCGATCTCG ACGCGCTCGC GGACGAGATG 
CGCGAGCGGT TTCGCGGCAC GCGCGTGATC GGCTGCACGA CAGCCGGCGA GATCGGGCCG 
GCCGGCTACC GCAACGACAG TCTCGTCGCG GTTGCGCTGC CGCGCGCGCT GTTTACCGTC 
GAAACCGCGC TGCTCGAGGA TCTGCAGACG TTTACGATCG CAAGCGGGCA TGCCTGCGCG 
CTCGACGCGC TGCACGATCT GGAGCGACGC GCGCCGCGCG CGAGCGGCGC GAATTCGTTC 
GCGCTGCTGT TGATCGACGG ATTGTCGGTG CGCGAGGAGC CCGTCACGCG CACGCTGCAG 
GGCGCGCTCG GCGACATCGC GCTCGTCGGC GGCTCGGCGG CCGACGATCT GCGTTTCGAG 
CGAACCGCGA TCTTCTACGA CGGGCGGTTC CGCGACGATT GCGCGGCGCT GATCGTCGCG 
TCGACCGCGC TGCCGTTTCG CACGTTCAAG ACCCAGCATT TCCGCTGCGG CACCGAGCGG 
CTCGTCGTCA CGCAGGCGGA TGCGGAACGC CGCACCGTCA GCGAGATCAA CGGGCTGCCC 
GCCGCGGAGG AATACGCGCG CCTCATCGGC GCGCGCGTCG AGGATCTCAG CCCCGGCCAC 
TTCGCGGCGG CGCCCGTCGT CGTGCTGATC GACGGCACCG ATTACGTGCG ATCGATCCAG 
AAGCTCAACC CGGACGGCAG CCTCACGTTC TACTGCGCGA TCGAGGAGGG CCTCGTGCTG 
CGCGTGGCGC GCGCGCTCGA TCTCGTCGAC AACCTGCAGG CGACGTTCGG CGATTTGCGC 
GACTCGTTCG GCGAGCCGCA GCTCGTGCTC GCGTGGGATT GCATCCTGCG CCATCTCGAG 
ATGATGCAGC GGGGCACGCG CGATACCGCG GCGGAGGTGC TGAAGGCGAA CCATGCCGTC 
GGCTTCAGCA CCTACGGCGA ACAGTACGGC GGCGTTCACG TGAACCAGAC GCTCACCGGC 
ATCGTCTTCA GTCGCGCGCC GGAGCCCGAC CGTGGCTGA

Protein sequence

MKGRSVVTML SSTIPAVHST CAHARDAVRE VHAALANCDA ELVLFFCSSR FDLDALADEM 
RERFRGTRVI GCTTAGEIGP AGYRNDSLVA VALPRALFTV ETALLEDLQT FTIASGHACA 
LDALHDLERR APRASGANSF ALLLIDGLSV REEPVTRTLQ GALGDIALVG GSAADDLRFE 
RTAIFYDGRF RDDCAALIVA STALPFRTFK TQHFRCGTER LVVTQADAER RTVSEINGLP 
AAEEYARLIG ARVEDLSPGH FAAAPVVVLI DGTDYVRSIQ KLNPDGSLTF YCAIEEGLVL 
RVARALDLVD NLQATFGDLR DSFGEPQLVL AWDCILRHLE MMQRGTRDTA AEVLKANHAV 
GFSTYGEQYG GVHVNQTLTG IVFSRAPEPD RG