Gene BURPS1710b_A1780 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A1780
Symbol	hmuS
ID	3693909
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	-
Start bp	2167997
End bp	2169205
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	72%
IMG OID	637732034
Product	hemin transport protein HmuS
Protein accession	YP_336937
Protein GI	76819443
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3720] Putative heme degradation protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGCCCG CACGCTTTTT TCCCAACCCG ACCGCCCGGC AATCGAGGAT CTCCGACATG 
ATGAACACCG CCGCCCCCGC CGCTTCGCCC GCCCGCGCGC TCGCGCCCGA CGAGCTGCGC 
GACGCGTTCC TGCACCTGAA AGAAACCCGC AAGCTGCGCA ACCGCGACGT CGCGCAACTG 
CTCGGCGTGA GCGAAGGCGA GGCGCTCGCC GCCTTCGCGG GCGAGCGCGT CGTGCGGCTC 
GAATCGAGCT TCGTCGAGCT GTTCGAGGAG ATGCCGCGCT TAGGCGGCGT GATGGCGCTC 
ACGCGCAACG CGGCCGCCGT GCACGAGAAG GACGGCGCGT TCGAGCAGAT GAGCCACGAC 
GGCCCGGTCG GCCTCGCGCT CGGCGCGATC GACCTGCGCA TCTTCTACCG CAACTGGGCG 
GCCGGGTTCG CCGTCTACGA GCCGACCGCG CACGGCGTGA TGAAGAGCCT GCAGTTCTTC 
GACGCGCAGG GCGACGCGGT GCACAAGGTC TACCTGCGCA AGCACAGCGA TCACGCCGCG 
TTCGACGCGT TCGTGTCGCG CTGGCGGATG CCCGTGCAAT CGCCGGCGTT CGCGGTCGAG 
CCCGCGCCGC CCGCGCATGT CGAACGGCCC GACGGCGAGA TCGACGCCGC GGGGCTGCGC 
GCCGCGTGGG ACGCGATGAC GGATACGCAC CAGTTCCACG GCGTCGTGCG CCGCCACGGC 
GTGTCGCGCA CGCAGGCGCT GCGGCTCGCC GGCGCGTCGC GCGCGCATCG CGTCGCGACC 
GATGCGGCGC GGCGCGTGCT GGAGCGCGCC GCGCAGACGC GGCTGCCGAT CATGGTGTTC 
GTCGGCAACC GCGGCATGAT CCAGATCCAC ACCGGCGCCG TGACGAACAT CCGCCGCATG 
GGCACGTGGA TCAACGTGCT CGACGAGGAT TTCAACCTGC ATCTGCGCGA GGATCTCGTC 
GCGTCCGCGT GGGTCGTGAG AAAGCCGACG AGCGACGGCG CCGTCACGTC GGTCGAGCTG 
TTCGACGCGG CGGGCGACAA CATCGCGATG TTGTTCGGCG CGCGCAAGCC CGGACAGCCG 
GAACTCGCGG GCTGGCGCGA ACTGGCGGGC GCGCTGCCGA GGCTCGACAC GGCGGATGCG 
GCGGATGCGG CGACCGTCGC GCATGCCGCC GACGTCCCCG TCGCGACCGA CGCCGGAGCC 
GCGCGATGA

Protein sequence

MRPARFFPNP TARQSRISDM MNTAAPAASP ARALAPDELR DAFLHLKETR KLRNRDVAQL 
LGVSEGEALA AFAGERVVRL ESSFVELFEE MPRLGGVMAL TRNAAAVHEK DGAFEQMSHD 
GPVGLALGAI DLRIFYRNWA AGFAVYEPTA HGVMKSLQFF DAQGDAVHKV YLRKHSDHAA 
FDAFVSRWRM PVQSPAFAVE PAPPAHVERP DGEIDAAGLR AAWDAMTDTH QFHGVVRRHG 
VSRTQALRLA GASRAHRVAT DAARRVLERA AQTRLPIMVF VGNRGMIQIH TGAVTNIRRM 
GTWINVLDED FNLHLREDLV ASAWVVRKPT SDGAVTSVEL FDAAGDNIAM LFGARKPGQP 
ELAGWRELAG ALPRLDTADA ADAATVAHAA DVPVATDAGA AR