Gene Namu_4033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4033
Symbol
ID	8449652
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	4447195
End bp	4448397
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	76%
IMG OID	645043078
Product	benzoate transporter
Protein accession	YP_003203314
Protein GI	258654158
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3135] Uncharacterized protein involved in benzoate metabolism
TIGRFAM ID	[TIGR00843] benzoate transporter

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	0.485429
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0404711
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACGTT CGTGGACGCA GCCCGTCGGC GTCGGCGTGG TAACGGCGCT GGTCGGGTTC 
ACCAGCTCGT TCGCGGTGGT GCTGGCCGGC CTGCAGGCGG TGGGGGCCGA CACCGCCCAG 
GCCGCCTCCG GGCTGGCCGT GCTCTGCGTG CTGCAGGGCG CCGGCACGAT CTGGCTGAGC 
CAGCGGCACC GCACCCCGCT GACCCTGGCC TGGTCGACGC CCGGCGCGGC GCTGCTGGTC 
GCCGCGGCCG GCCTGCAGAT CGGGTGGTCG GCGGCCGTCG GGGCGTTCGT CGTGACCGGG 
GCATTGCTGG CCATCACCGG GCTGTGGCCG TGGTTGGGCC GGACGGTCGC CCGGATCCCG 
GCCCCGCTGG CCCAGGCGAT GCTGGCCGGC GTGCTGCTGA CCCTGTGCCT GCAGCCGATC 
ACCGCGCTGA CGGTCAGCCC GTTGCTGGTC GCCCCCGTGA TCGTCGTCTG GCTGGGGTTG 
CAGCGGCTGG CCCCGCGCTG GTCGACCCCG GCCGCGTTCC TGCTCGCGCT GGCCCTGATC 
GTGGGTGATG CCGTGCTGTC CGGTCAGGGC GTCACACTGC TGGCGCCGGT CGTGAGCCTC 
ACCGTCCCCA CCGTCACCTG GACCGCGGTC GTCGGCATCG CGATACCGCT GTACGTGGTG 
ACCATGGCCT CGCAGAACGT GCCCGGGGTG GCCGTGATGA GCGCCGCCGG GTACGCGGTG 
CCCTGGCGGG AGTCCTTGCT GCTGACCGGC CTGGGCACGA TGGCCGGTGC CGGCGCCGGG 
GCCCACGCGG TCAACCTGGC CGCGATCAGC GCGGCGCTGC CGGCGTCCGC CGAGGCCCAC 
CCGGACCCCC GCCGCCGGTG GATCGCCTCG ACCACCGCCG GCGTGACCTA CCTGTTGCTG 
GCCCCGCTGG CGGCCACGTT GACCGCCCTG GTGGCCGGGG CTCCGCCCGG CGTCATCGAG 
TCGGTGGCCG GGCTGGCCCT GCTCGGCACC CTGGCCGCCT GCCTGGCCGC CGCGACCGCC 
GATCCGGGCG AGCGGCTGCC GGCGGTGGCG GCGTTCCTGG TCGCGGCCAG CGGGGTGAGC 
GCGCTGGGCA TCGGTGCGGC GTTCTGGGCG CTGCTGGCCG GGTTGGCGGT GCGGACCGTG 
CTGCGGCCCC GCGATCCTCG AGCCGCCGAG AAGCCTCGAT CGGGCCGGCA CGCCCGCGTC 
TAA

Protein sequence

MERSWTQPVG VGVVTALVGF TSSFAVVLAG LQAVGADTAQ AASGLAVLCV LQGAGTIWLS 
QRHRTPLTLA WSTPGAALLV AAAGLQIGWS AAVGAFVVTG ALLAITGLWP WLGRTVARIP 
APLAQAMLAG VLLTLCLQPI TALTVSPLLV APVIVVWLGL QRLAPRWSTP AAFLLALALI 
VGDAVLSGQG VTLLAPVVSL TVPTVTWTAV VGIAIPLYVV TMASQNVPGV AVMSAAGYAV 
PWRESLLLTG LGTMAGAGAG AHAVNLAAIS AALPASAEAH PDPRRRWIAS TTAGVTYLLL 
APLAATLTAL VAGAPPGVIE SVAGLALLGT LAACLAAATA DPGERLPAVA AFLVAASGVS 
ALGIGAAFWA LLAGLAVRTV LRPRDPRAAE KPRSGRHARV