Gene Namu_4898 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4898
Symbol
ID	8450528
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	5464315
End bp	5465721
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	72%
IMG OID	645043936
Product	major facilitator superfamily MFS_1
Protein accession	YP_003204161
Protein GI	258655005
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.724169
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCATTC CCGTCGACCA ATCCCGCGCG CCCGGCTGGC GCACCGAGAT CACCCGGGTC 
CAGTGGCTGG TGCTGCTGGG CACCACGCTG GGCTGGGCCC TGGACGGCTT CGCCGGCAGC 
CTGTACGCGC TGGTGCTCGG CCCGGCGATG ACCGAGCTGC TGCCCAACAG CGGCATCACC 
CCGGCCCCGG CGTCCATCGG CCTGTACGGC GGCCTGACCG TCGCCCTGTT CCTGGCCGGG 
TGGGCCACCG GCGGCATCCT GTTCGGCGTG CTGGCCGACT ACTTCGGTCG CACCAAGGTG 
CTCTCCATCG GCATCCTGAC CTACGCCGTG TTCACCGCGG CCGCCGCCTT CGCCGACACC 
TGGTGGCAGC TGGGCATTCT CCGGTTCATC GCCGGCCTGG GCTCGGGGGT GGAAGCCCCG 
GTGGGCGCCG CCCTGGTCGC CGAGGTCTGG CGAAACCGCT ACCGGGCCAA GGCCTGCGGC 
GTCATGATGT CCGGCTACGC GGCCGGCTTC TTCATCGCCG CCCTGGCCTA CGCGGTCCTG 
GGCAGCCACG GCTGGCGGAT CATGCTGGGG CTGGCCGTCA TCCCGGCGGT GCTGGTCTGG 
TTCATCCGCC GCTACGTGCC CGAGCCGGCG GAGATCACCT CGGCGATCAG CGCCCGCCGG 
CGGCGCCGGG AGGCCGGCAA GCGTGACGAG CAGGACCGTT TCGTCCTCGG CCGGCTGGTC 
CGCCCGCCGC TGCTGCGCAA CACCCTGATC TGCACGGCCC TGGCCACCGG TTCGCTAATC 
GCGTTCTGGA GCGTGTCCAC CTGGTACCCG CAGATCATCC GGCTGGCCAC CGCGGCCGAG 
TCGCTGCCGG TGGACGTCGG CAACAGCCGG GTCGCCCTGG CCTCCATGCT GTTCAACGCG 
GGCGGCGTCG CCGGTTACGC CTCCTGGGGC TTCCTGGCCG ACGCGATCGG CCGGCGCAAG 
GCCTTCGCCA TCAGCTTCGC GGTGTCCGCG GTCAGCATCG CGTTCCTGTT CCCGTTCGAG 
CACAGCTTCA CCACGTTCCT GGTGATGATG CCGGTGCTGG GCTTCGGCCT GTTCGGCGCG 
CTGTCCGGAA CCTTCGTCTA CGGTCCCGAG ATCTTCCCGC CGAGCGTGCG GGCCACCGGC 
ATGGCCCTGG CCAACAGCGT CGGCCGCTAC ATCACCGCGG CCGGCCCGCT GATCGCCGGC 
GTCATCGCCG CCAGCTGGTT CGGCGGCGAC CTGGGCCTGG CCACCACCTG CGTGGCCGCA 
TTCGGGCTGA TCGCCCTGGT CGGCCTGGCC TTCGCGCCGG AGACCAAGGG CGCCGCGCTG 
CCCACCGATC CCGGCGTCAC CCTCCCCCCG CCCGCCGCAC CTGCCCCCGT CCAGGCGGCC 
GCCACCACCC AGGAGCACAC GTCATGA

Protein sequence

MSIPVDQSRA PGWRTEITRV QWLVLLGTTL GWALDGFAGS LYALVLGPAM TELLPNSGIT 
PAPASIGLYG GLTVALFLAG WATGGILFGV LADYFGRTKV LSIGILTYAV FTAAAAFADT 
WWQLGILRFI AGLGSGVEAP VGAALVAEVW RNRYRAKACG VMMSGYAAGF FIAALAYAVL 
GSHGWRIMLG LAVIPAVLVW FIRRYVPEPA EITSAISARR RRREAGKRDE QDRFVLGRLV 
RPPLLRNTLI CTALATGSLI AFWSVSTWYP QIIRLATAAE SLPVDVGNSR VALASMLFNA 
GGVAGYASWG FLADAIGRRK AFAISFAVSA VSIAFLFPFE HSFTTFLVMM PVLGFGLFGA 
LSGTFVYGPE IFPPSVRATG MALANSVGRY ITAAGPLIAG VIAASWFGGD LGLATTCVAA 
FGLIALVGLA FAPETKGAAL PTDPGVTLPP PAAPAPVQAA ATTQEHTS