Gene BURPS1106A_0343 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0343
Symbol
ID	4899949
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	316531
End bp	317721
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	71%
IMG OID	640133573
Product	hypothetical protein
Protein accession	YP_001064626
Protein GI	126451987
COG category	[S] Function unknown
COG ID	[COG1565] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0374888
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCCGA AAGCTCACGA ACCCGCTAGT TTACCCGTTC CCGGCCCCGA CGCGCTCGCG 
CAGTCCGACG CGCTCGCCGC GTCGCTGCGC GCCGAAATCG CCGCGGCGGG CGGATGGATC 
CCGTTTTCCC GCTACATGGA GCGCGTGCTG TACGCGCCGG GCCTGGGTTA CTACAGCGGC 
GGCGCGCAGA AATTCGGCCG GCGCGGCGAC GACGGCAGCG ATTTCGTGAC CGCGCCCGAG 
CTGTCGCCGC TCTTCGCGCA GACGCTCGCG CGCCCCGTCG CGCAGGCGCT CGCCGCGAGC 
GGCACGCGGC GGGTGATGGA ATTCGGCGCG GGCACGGGCC AGCTCGCGGC GGGGCTGCTG 
AACGCGCTCG CCGCGCTCGG CGTCGAGCTC GACGAATATG CGATCGTCGA TTTGTCCGGC 
GAGCTGCGCG CGCGCCAGCG CGAGACGCTC GACGAACAGG CGTCCGGCGC CGCCGCGCGC 
GTGCGCTGGC TCGACGCGCT GCCCGAGCGC TTCGAGGGCG TGATCGTCGG CAACGAAGTG 
CTTGACGCGA TGCCGGTGCA ACTCGTCGCG AAGCATGCGC ACGGCTGGTG CGAGCGCGGC 
GTGTCGCTCG GCGATGCGGG CGCGTTCGCG TTCGCCGACC GGCCGCTCGC GCGCGCCGAG 
GACGCGGCGC GGCTCGCGGC GCTCGACGCC GACGAAGGTT ACGTGACCGA GACGCACGAC 
GCGGCGGCGG CGTTCGTCGG CACGGTCTGC GCGATGCTCG CGCGCGGCGC GGCGTTGTTC 
ATCGACTACG GTTTTCCGCG CCACGAGTAC TATCACCGGC AGCGCGCGCA GGGCACGCTG 
ATGTGCCATT ACCGGCACCG CGCGCACGGC GATCCGTTCG TCTATCCGGG GCTGCAGGAC 
ATCACCGCGC ATGTCGAATT CAGCGCCGTC TACGAGGCGG GCGTCGGCGC GGGCGCTGAG 
CTGCTCGGCT ACACGTCGCA GGCGCGCTTT CTGCTGAACG CGGGCATCAC CGACGTGCTC 
GCCGAGATCG ACCCGTCCGA CGCGCAACGC TTCCTGCCCG CCGCGAACGC GGTGCAGAAG 
CTGATTTCCG AGGCGGAGAT GGGCGAGCTC TTCAAGGTGA TCGCGTTCTC GCGCGGCATC 
GACGGCACGC TCGACGCGTT CGCGCGCGGC GATCGTTCGC ACACGCTGTA G

Protein sequence

MNPKAHEPAS LPVPGPDALA QSDALAASLR AEIAAAGGWI PFSRYMERVL YAPGLGYYSG 
GAQKFGRRGD DGSDFVTAPE LSPLFAQTLA RPVAQALAAS GTRRVMEFGA GTGQLAAGLL 
NALAALGVEL DEYAIVDLSG ELRARQRETL DEQASGAAAR VRWLDALPER FEGVIVGNEV 
LDAMPVQLVA KHAHGWCERG VSLGDAGAFA FADRPLARAE DAARLAALDA DEGYVTETHD 
AAAAFVGTVC AMLARGAALF IDYGFPRHEY YHRQRAQGTL MCHYRHRAHG DPFVYPGLQD 
ITAHVEFSAV YEAGVGAGAE LLGYTSQARF LLNAGITDVL AEIDPSDAQR FLPAANAVQK 
LISEAEMGEL FKVIAFSRGI DGTLDAFARG DRSHTL