Gene BURPS1106A_A1528 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1528
Symbol
ID	4906409
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	1476415
End bp	1478139
Gene Length	1725 bp
Protein Length	574 aa
Translation table	11
GC content	73%
IMG OID	640144634
Product	putative hydrogenase subunit
Protein accession	YP_001075562
Protein GI	126456901
COG category	[C] Energy production and conversion
COG ID	[COG3261] Ni,Fe-hydrogenase III large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGAATCG ACGCATTGCG AATGTCCGGT CAGACGCGCA TCGCGAGCGC GGCGGGGCAG 
CCGCGCGCCG TGTTCGCGTC GGTCGACGCC GACGCATGGA CGCGCGCCGC CGAGACGATC 
CGGACGGCCG GCGGGCGGCT CGTCACGCTG TGGGGCGGCG AGCCCGCGGC CGGGCGCTAC 
GAGGTCTGCG CCGCGTACGA GCTGGACGAC GGGCTGTTGT GGCTGCGCCT GCCGGTCGAG 
CCGGCGGCGA ACGTGGGGCG GGAAGCCGGC GACACGAGCA ACGCGGGCAA CGCGAGCAAT 
GCGGGCGACG CGGACGGCGT GCGGCAACGC GGCGAGGCCG GCAGCTATCC GGATCTGTCG 
GCGATCTTCG CGAGCGCGAC GCGGATGCAA CGGGCGCTTC ACGATCTCGT CGGCCTGCGC 
GCGCGCGGCG CGCACGACAC GCGGCCGTGG CTCGCCCACG GCGCATGGCC GCGCGATTAC 
CACCCGCTGC GCAGGCGCGC GACGGGCGGC GAGCGCTTCG AGTACGCGAC GGCCGACTAT 
CCGTTCGTGC CGGTCGCGGG CGACGGCGTG CATGAGATCG CGGTCGGGCC GATTCATGCG 
GGCGTGATCG AGCCCGGGCA TTTCCGCTTT TCCGTCGTCG GCGAAAAGGT GCTGCGGCTC 
GAGGAGCGGC TTGGCTACGC GCATCGCGGC GTCGAACGGC TCTTCGAGCG CGCGGATGCG 
CTCGCGGGCA GCCGGCTCGC CGCGCGCATC GCCGGCGATT CGACGGTCGC GTTCGCGTGG 
GCGTACTGCA TGGCGCTCGA ACAGGCGTTG AGAATCCGCG TGCCGGACCG CGCGCTGCGG 
CTGCGCGCGC TGCTGCTCGA GCGCGAGCGC GTCGCGAACC ATCTGGGCGA CCTCGGCGCG 
CTCGGCAACG ACGCGGGTTT TGCCGTGGGC CTCGCGCATT TCTCGCGGCT CAAGGAAGAC 
TGGCTGCGGA TGCAGGACCG GATCTTCGGG CATCGCTACC TGATGGACGC GATCGTGCCG 
GGCGGCGTCG CGCGCGACAT CGCGGCGGAC GACGCCGCGG CGATCGTCGC GCAGTGCGAC 
CGGATCGAGC GTGAAGTGCG CGCGATGCAA ACGATCTACG ACGATCAATC CGGCCTGCAG 
GACCGCTTCG CCGGCACCGG GCGGCTCGAC GCGCAGGCGG TCGCGCATTT CGGCGTATGC 
GGGCTCGCCG CCCGGGCGAG CGGGCAGCCG CGCGACGTGC GCGCGGACCA TCGGCTGGCG 
CCATACGACG CGCTGCGCAT CGACGTCAGC CGCGACGCGC GCGGCGACGT CGCGGCGCGC 
GTCGCGGTGC GCTTCGCCGA AACGTACGAG TCGATGCGCG CGATCCGCGC GCTGCTCGCG 
GACTTGCCGG ACGACGGGCT CGCCGCGGAG ATCGCGCCCG GCGCGACTGT TCCGGGCGCG 
CGCGCCGATG CGGGCGGAGC ATGCGAAGGG GAAGAGGGGG GCGACGCCGC ATTCTGCCCG 
GGCGACGCGC GGCGGCGCGG CATCGGCTGG ATCGAAGGCT GGCGCGGGCC CGTGTTCGTC 
GCGCTCGAAC TCGATGCGCG CGGCGCCGTC GCGCGCTGCC ATTGCCACGA TCCGTCATGG 
CACAACTGGC CCGCGCTCGA GCATGCGATC ATCGGCAACA TCGTCGCGGA CTTCCCGTTG 
ATCAACAAGT CGTTCAACCT GAACTACGCG GGGCACGACC TGTAA

Protein sequence

MRIDALRMSG QTRIASAAGQ PRAVFASVDA DAWTRAAETI RTAGGRLVTL WGGEPAAGRY 
EVCAAYELDD GLLWLRLPVE PAANVGREAG DTSNAGNASN AGDADGVRQR GEAGSYPDLS 
AIFASATRMQ RALHDLVGLR ARGAHDTRPW LAHGAWPRDY HPLRRRATGG ERFEYATADY 
PFVPVAGDGV HEIAVGPIHA GVIEPGHFRF SVVGEKVLRL EERLGYAHRG VERLFERADA 
LAGSRLAARI AGDSTVAFAW AYCMALEQAL RIRVPDRALR LRALLLERER VANHLGDLGA 
LGNDAGFAVG LAHFSRLKED WLRMQDRIFG HRYLMDAIVP GGVARDIAAD DAAAIVAQCD 
RIEREVRAMQ TIYDDQSGLQ DRFAGTGRLD AQAVAHFGVC GLAARASGQP RDVRADHRLA 
PYDALRIDVS RDARGDVAAR VAVRFAETYE SMRAIRALLA DLPDDGLAAE IAPGATVPGA 
RADAGGACEG EEGGDAAFCP GDARRRGIGW IEGWRGPVFV ALELDARGAV ARCHCHDPSW 
HNWPALEHAI IGNIVADFPL INKSFNLNYA GHDL