Gene BURPS1106A_0749 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0749
Symbol
ID	4900877
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	728472
End bp	729770
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	66%
IMG OID	640133979
Product	cytochrome c family protein
Protein accession	YP_001065031
Protein GI	126454256
COG category	[C] Energy production and conversion
COG ID	[COG2010] Cytochrome c, mono- and diheme variants
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGCA AGTCCCTGTT TGCACTCTCG GCTGTCGCGA TCGTCGCGGC AGCGGCTCTC 
GTGCCCGTCC TGTGGCCGGG CAACGACACG CTGCACGGCA ACGCCGCCGT CGCCGCGACG 
CCCGCCGATC AGGCCGCGCT CATCAAGAAG GGCGAATACC TCGCGCGCGT CGGCGACTGT 
ATCGCGTGCC ACACCGTGCG CGGCGGCAAG CCGTTCGCGG GCGGCCTGCC GATGGCCACG 
CCGTTCGGCA CGATGTACAC GCCGAACATC ACGCCGGACG ACCAGGCCGG CATCGGCAAG 
TGGACGTCGG ACGATTTCTA CCGCGCGATG CACACGGGCC GCTCGAAGGA CGGCAGCCTG 
CTCTATCCGG GCTTCCCGTT CGCGAGCTAC ACGAAGGTCA CGCGCGCGGA TTCGGACGCG 
ATCTACGCGT ACCTGCGCTC GGTCGCGCCC GTGAGCACGC CGAGCCGTCC GCACGAGCTG 
CGCTTCCCGT TCAACAACCG CAACCTGCTG ATCGGCTGGC GCACGCTGTT CTTCAAGGAA 
GGCGAGTACA AGCCGGACCC GACGAAGTCG GTCGAATGGA ACCGCGGCGC GTATCTCGTC 
GAAGGCCTCG GCCATTGCTC GATGTGCCAC ACGTCGATCA ACATGATGGG CGGCCCGGTG 
AGCTCGGCGG CCTTCGCGGG CGGCCTGATT CCGCTGCAGA ACTGGTACGC GCCGTCGCTC 
ACGAACGACA AGGAGCTCGG CCTCGGCGAC TGGCATGTGC AGGAGCTGTC CGATCTGCTG 
CAGGCGGGCG TGTCGCACAA GGGCGCGGTG TTCGGCCCGA TGGCGGACGT CGTCCACAAC 
AGCCTGCAAT ACATGACGGA CGAGGACACG CGTGCGATGT CGACTTACCT GAAGTCGATC 
CCGCAGAAGG CCGAAGCGCC GAAGAACATG CAGTACGAGC CGTCCAAGCA GTTCGGCACG 
GCGCTGCTCG AGCAAGGCAA GAAGATCTAT GCCGACAACT GCGCGACCTG CCACGGCCCG 
CAGGGCGAAG GCAAGCCGAC CGCTTACCCG CCGCTCGCGC AGAACCGTTC GATCATGATG 
GAATCGGCCG TCAATCCGAT CCGCATGGTG CTGAACGGCG GCTATCCGCC CAGCACGTTC 
AAGAATCCGC GTCCGTACGG GATGCCCCCG TTCGCGCAGT CGCTGTCGAA TCAGGAAGTC 
GCGGCGGTCG TCACGTACAT CCGGATGTCG TGGGGCAACA ACGGTTCGCC GGTCTCGCCG 
CAACAGGTGA GCGACCTGCG TTCCGCACCG CTCGACTAA

Protein sequence

MKRKSLFALS AVAIVAAAAL VPVLWPGNDT LHGNAAVAAT PADQAALIKK GEYLARVGDC 
IACHTVRGGK PFAGGLPMAT PFGTMYTPNI TPDDQAGIGK WTSDDFYRAM HTGRSKDGSL 
LYPGFPFASY TKVTRADSDA IYAYLRSVAP VSTPSRPHEL RFPFNNRNLL IGWRTLFFKE 
GEYKPDPTKS VEWNRGAYLV EGLGHCSMCH TSINMMGGPV SSAAFAGGLI PLQNWYAPSL 
TNDKELGLGD WHVQELSDLL QAGVSHKGAV FGPMADVVHN SLQYMTDEDT RAMSTYLKSI 
PQKAEAPKNM QYEPSKQFGT ALLEQGKKIY ADNCATCHGP QGEGKPTAYP PLAQNRSIMM 
ESAVNPIRMV LNGGYPPSTF KNPRPYGMPP FAQSLSNQEV AAVVTYIRMS WGNNGSPVSP 
QQVSDLRSAP LD