Gene BTH_II2140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BTH_II2140
Symbol
ID	3844539
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia thailandensis E264
Kingdom	Bacteria
Replicon accession	NC_007650
Strand	+
Start bp	2628827
End bp	2630035
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	70%
IMG OID	637839441
Product	hemin transport protein HmuS
Protein accession	YP_440328
Protein GI	83717128
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3720] Putative heme degradation protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.770349
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGCCCG CACGCTTTTT ATCCAGCCGG CTTGTCCGGC AATCGAGGAT CTCCGACATG 
ATGAACACCG CCGCTCCCGC CTCTTCGTCC GCCCGCGCGC TCGCACCCGG CGAACTGCGC 
GACGCGTTCC TGCATCTGAA AGAAACCCGC AAGCTGCGCA ACCGCGACGT CGCGCAACTG 
CTCGGCGTGA GCGAAGGCGA GGCGCTCGCC GCGTTCGCGG GCGAACGCGT CGTGCGGCTC 
GAGCCGAGCT TCGTCGAGCT GTTCGAGGAG ATGCCGCGGC TCGGCAGCGT GATGGCGCTC 
ACGCGCAACG CGGCCGCCGT GCACGAGAAG GACGGCGCGT TCGATCAGAT GAGCCACGAC 
GGCCCGGTCG GCCTCGCGCT CGGCGCGATC GACCTGCGGA TCTTCTACCG CAACTGGGCG 
GCGGGCTTCG CCGTCTACGA GCCGACCGCG CACGGCGTGA TGAAGAGCCT GCAGTTCTTC 
GATGCGCAAG GCGACGCGGT GCACAAGGTC TACCTGCGCA AGCACAGCGA TCACGATGCA 
TTCGACGCGT TCGCGTCGCG CTGGCGGATG CCCGTGCAAT CTCCGACGTT CGCGGCCGAG 
CCCGCGCCGC GCGCGACCGT CGAGCGGCCC GACGCAGACG TCGACGCCGC GGGCCTGCGC 
GCCGCATGGG ATGCGATGAC CGATACACAC CAGTTCCACG GCGTCGTGCG CCGCTTCGGC 
GTGACGCGCA CGCAAGCGCT GCGGCTCGCC GGCGCGCCGC GCGCGCATCG CGTGACACCC 
GACGCGACGC GGCGCGTGCT CGAGCGCGCC GCGCAAACGC GGCTGCCGAT CATGGTGTTC 
GTCGGCAATC GCGGCATGAT CCAGATCCAT ACCGGCACCG TGACGAACAT CCGCCGCATG 
GGCTCGTGGA TCAACGTGCT CGACGAGGAT TTCAACCTGC ATCTGCGCGA GGATCTCGTT 
GCGTCCGCGT GGGCCGTGAA GAAACCGACG AGCGACGGCG TCGTCACGTC GGTGGAGCTG 
TTCGATGCGG CGGGCGACAA CATCGCGATG CTGTTCGGCG CGCGCAAGCC CGGGCAGCCG 
GAGCTCGCGG GCTGGCGCGA GCTGGTCGGC GCGCTGCCGA AAATCGATGC GGCGGATGCG 
GCGAGCTCGG CGAACGCCGC GGATTCGATC GACGTGCACG GCTCGACCGA CGCCGAGGCC 
GCGCGATGA

Protein sequence

MRPARFLSSR LVRQSRISDM MNTAAPASSS ARALAPGELR DAFLHLKETR KLRNRDVAQL 
LGVSEGEALA AFAGERVVRL EPSFVELFEE MPRLGSVMAL TRNAAAVHEK DGAFDQMSHD 
GPVGLALGAI DLRIFYRNWA AGFAVYEPTA HGVMKSLQFF DAQGDAVHKV YLRKHSDHDA 
FDAFASRWRM PVQSPTFAAE PAPRATVERP DADVDAAGLR AAWDAMTDTH QFHGVVRRFG 
VTRTQALRLA GAPRAHRVTP DATRRVLERA AQTRLPIMVF VGNRGMIQIH TGTVTNIRRM 
GSWINVLDED FNLHLREDLV ASAWAVKKPT SDGVVTSVEL FDAAGDNIAM LFGARKPGQP 
ELAGWRELVG ALPKIDAADA ASSANAADSI DVHGSTDAEA AR