Gene Namu_3351 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3351
Symbol
ID	8448966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	3687480
End bp	3688814
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	66%
IMG OID	645042428
Product	major facilitator superfamily MFS_1
Protein accession	YP_003202668
Protein GI	258653512
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.0813627
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0585989
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCACCT CGCATTCGCA TTCACTGGAA GGCAACGCCC ACGGGACCAC CAGCACACGC 
AAGGTGGCCG TCAGCTCGGG AATCGGGGCC ACGATCGAGG CCTACGACTT CATCGGGTAT 
GGCACCGCGG CGGCGTTGTA CTTCAGCCAT GACTTCTTCC CCTCCAGTGA CCCGCTCACC 
GGAACGCTGC TGTCCTTCGC CACCCTGGGG GTCGGTTTCG CGGTCCGCCC GCTGGGTGGC 
GTGATCGGCG GGTACCTGGG CGACAAGGTT GGCCGCAAGC CGGTTCTCGT GGCCAGCCTG 
ATCCTGATGG GACTGGCCAC GTTCTTCATC GGGCTCCTGC CGACCTATGA GACGGTGGGT 
ATCTGGGCCG GCATCCTGCT CGTGCTCGTC CGGGTCGTCC AAGGGTTGGC CTACGGCGCC 
GAATGGGGCG GGGCGATCCT GATGACCTAC GAACACGCGC CCTGGCGGTC GAAGGGCAAG 
TACACCGGCA TCGTCCAGTC CGGCTTCCCG GTCGGTCTGC TGCTGGCCAA CCTGGTCTTC 
CTGGTCTCGG TTCACCTGCC CGGAACCTGG GCCTGGCGCG TGCCGTTCCT GCTGTCCATC 
ATCCTGGTCA TCGTCGGCCT GGTCATCCGC TCCAAGGTGC CCGAGTCCCC GGTCTTCGAG 
GAGGTCAAGG CCCGCGGCGA GATCGTCAAG AACCCGATCA CCCAGGTCCT GCGGGACGAC 
TGGCGCAACA TCCTGCGCGG CATCGGCCTG CGTGTGGCCG AGACCGCCGG CTACGCCGTG 
GCCATCACTT TCATGTTGTC GTACCTCAAG ACCGAGCACC TGGCCGACAA CACTTTGACC 
CTGACGGCCA TCTGCGTGGC CTCCGCGATC GGCATTTTCG CCACTTACAA CTGGGGCAAG 
GCCACCGACA AGGTGGGGCG CCGACCGATC TACCTGTTCG GCACCTTGGT CATGGTCGTC 
TTCGCGTTCC CGATGTTCCT GCTGGTCAAC ACGGGCGTCG CGGTGCTGAT CGTGATCGCC 
GTGGTCATCG CCTATGCCGT CTGCCAGAAC TCGCTGGCGG GCGCCCAGGG GTCCTGGTTC 
CCCGAGCTGT TCAACGCCAA CACCCGCTCC TCGGGCGCCT CGATGGCCTA CCAGTTCTCG 
GCCGTCGTCT CCGGGTTCAC CCCGTTCGTG GTCACCCTGC TCTACTCGGC CTGGGGCTGG 
ATGGGCGCCG CCGCCCTGTT CGGCTTCTAC GGACTGGTCG GGCTGATCGC CACGCTCGTG 
ACGAAGGAGA CCTTCGGACC GGTCGAGCGG GCCGCCGCGC TCGCCGAGGA CGAGACCATG 
CGGGTCGCCG CCTGA

Protein sequence

MSTSHSHSLE GNAHGTTSTR KVAVSSGIGA TIEAYDFIGY GTAAALYFSH DFFPSSDPLT 
GTLLSFATLG VGFAVRPLGG VIGGYLGDKV GRKPVLVASL ILMGLATFFI GLLPTYETVG 
IWAGILLVLV RVVQGLAYGA EWGGAILMTY EHAPWRSKGK YTGIVQSGFP VGLLLANLVF 
LVSVHLPGTW AWRVPFLLSI ILVIVGLVIR SKVPESPVFE EVKARGEIVK NPITQVLRDD 
WRNILRGIGL RVAETAGYAV AITFMLSYLK TEHLADNTLT LTAICVASAI GIFATYNWGK 
ATDKVGRRPI YLFGTLVMVV FAFPMFLLVN TGVAVLIVIA VVIAYAVCQN SLAGAQGSWF 
PELFNANTRS SGASMAYQFS AVVSGFTPFV VTLLYSAWGW MGAAALFGFY GLVGLIATLV 
TKETFGPVER AAALAEDETM RVAA