Gene BURPS1106A_A0997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0997
Symbol
ID	4905122
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	968193
End bp	969518
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	76%
IMG OID	640144103
Product	hypothetical protein
Protein accession	YP_001075033
Protein GI	126456288
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.525833
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGATGA GATTTCACCT CGTCCGCCGC CTGGGCCGTG CGGCATCGTT CGCGATCGGG 
CCGATGGCCT CGCTGCTGTT CGTCGCCCAC GGCGCCGCCG GCGCCGAGCC GCCGCGCGCG 
GCGCTGCTCG CGGCCGGATG CAAGACGCTC GCCGAGCGCG TGCATGCGAC CCCCGGCTCA 
GGGCCCGTCT TTCTCGGCAG CTACGAGCCC GCGCCCGGCG GCGCGGCGCT CGCGGGCGCG 
CTGACGCAGG CCGCGTTCGT CTATGACAAC GCGCTCGCGA GCATCGCGCT CATCGCCTGC 
CACCGCCCCG GCGACGCGCG CCGCATCGCC GACGCGATCC TGCAGGCGAG CCGGCAGGAT 
CGCCACTACC GCGACGCGCG CGTGCGCAAC GCGTACCGCG CGGGTGCGCT GCCGCCGGGG 
CCCGCACCGC TGCCCGGCTG GTGGGACACG CCGAGCAAGC GCTGGTTCGA GGACGCCTAT 
CAGGCGGGCA CCGCGACCGG CAACGTCGCG TGGGCCGCGC TGTCGCTGCT CGCCGTGTAC 
GAAGCGACGC GCGAGCGGCG CTATCTCGAC GGCGCCGCCG CGCTGATGGG CTGGGTCGAC 
CCCGGCCGGC TCGACGCGAC GGCGCCGGCC GGCTACGTCG GCGGCGAGTT CGGCCATGAG 
CCGCAGCCGC TCCGCCAGGG CTGGAAATCC ACCGAGCACA ACGTCGATGC GTACGCCGTC 
TTCCGCTGGC TCGCGGCGCG CACGGGCGAC GCCCGCTGGC ACGCGGCCGC CGGGCGCGCG 
CGGCGCTTCG TGTCGGCGAT GTGGGAGCCG GGCGACGGCC GCTTCCTGAT CGGCACGCGC 
GACGACGGGC ACACGCCGAA CACCGGGCCG TCCGCGCTCG ACGCGTCGCT CTGGCCGCTG 
CTCGCGATGC CGGATGCGCC CGCCGACTGG CGCCGCTCGC TCGCGTGGGT CGAGCGCGCG 
CATCGCATCG ACGGCGGCTA CGGCTTCAAC GCGCATCCGG ACGGTGTCTG GACCGAAGGC 
ACCGCGCAGG CGGCGCTCGC GTTGCAGGCG GCCGGCCGCT CGGACGACGC GCGGCCGCTG 
TGGGCGCTGC TGATGTCGCA GCGCGCGCCG TCCGGCCTGC TGTTTGCGAC GCCCGAGCCG 
AGCATTCGCA CCGGCCTGTC GATCGGGCCG ACGTCCAAGA CCGACGATTT CCGCTACTTC 
CATCTGCCGC ACCTGGGCGC GACCGCGTGG GCCGTGCTCG CGGCGGCGGG CTGGAATCCG 
TTTCGCCCCG GCGGCTGCCT CGCCGCGGGC TACCCGGGCG ACGCCGCCCC TGCCTGCGGA 
GCATGA

Protein sequence

MPMRFHLVRR LGRAASFAIG PMASLLFVAH GAAGAEPPRA ALLAAGCKTL AERVHATPGS 
GPVFLGSYEP APGGAALAGA LTQAAFVYDN ALASIALIAC HRPGDARRIA DAILQASRQD 
RHYRDARVRN AYRAGALPPG PAPLPGWWDT PSKRWFEDAY QAGTATGNVA WAALSLLAVY 
EATRERRYLD GAAALMGWVD PGRLDATAPA GYVGGEFGHE PQPLRQGWKS TEHNVDAYAV 
FRWLAARTGD ARWHAAAGRA RRFVSAMWEP GDGRFLIGTR DDGHTPNTGP SALDASLWPL 
LAMPDAPADW RRSLAWVERA HRIDGGYGFN AHPDGVWTEG TAQAALALQA AGRSDDARPL 
WALLMSQRAP SGLLFATPEP SIRTGLSIGP TSKTDDFRYF HLPHLGATAW AVLAAAGWNP 
FRPGGCLAAG YPGDAAPACG A