Gene Namu_4290 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4290
Symbol
ID	8449916
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	4772292
End bp	4773698
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	69%
IMG OID	645043338
Product	major facilitator superfamily MFS_1
Protein accession	YP_003203567
Protein GI	258654411
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.720009
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAGA TCGCACCCCG GGTCGGCAAG CCCGGCGAAG TGGCGCACGC CGATCCCAAG 
AACGTCCGGC GGGCCGCCTG GGCCGGCCTG GTCGGCACCG CCCTGGAGCA GTACGACTTC 
ATCATCTACG GCACCGCCTC CGCGCTGATC TTCAGCAAGC TGTTCTTCCC GAGCATCTCG 
CCGGTCGCCG GGATGATCGC CGCGTTCTCG GCCTACGCGA TCGGCTTCCT GGCCCGCCCG 
CTGGGCGGCC TGTTCTTCTC CCACTTCGGG GAGCGGTACG GCCGCAAGTG GGTGCTGGTC 
AGCACCCTGT TCCTGATGGG CGCGGCCACC TTCCTGATCG GCTGCCTGCC CACCTACGAG 
ACGGCCGGGG TGCTGGCCCC GATCCTGCTG GTGCTGCTGC GCTTCCTGCA GGGCTTCGGC 
GCCGGCGCCG AGCAGGCCGG TGGCGCCACC CTGCTCACCG AGACCGCACC GCTGGGCAAG 
CGCGGCCGGC TGGCCTCGTT CGTCATGGTC GGCGCCGCAT TCGGCACCGT GCTGGGCGCC 
CTGGCCTGGG TGCTCGCGCA GCTGCTGCCG GACGACGTCC TGCTGTCCTG GGGCTGGCGA 
ATGATCTTCT GGGCCAGCCT GTTCGTCACC GTGGGCGCCT GGATCATCCG GATGAAGATG 
GCCGAGAGCC CGATCTTCGT CGAGCTGAAG AAGTCGGTCG ACGTCGAGCA CGCGGCCCCG 
CTGAAGGAGG TCGCCAAGCA CGGCACCAAG AACGTGCTCA AGGTCATCTT CATGAACTGG 
GGCATCAGCA CGCAGTCCTA CACCTACCAG GTCTTCATGG CCTCCTACCT GATCACCTTC 
GTCGGGGTGG ACAAGCATTT CGTGCCCAAC GTGCTGCTCT ACGGCGCGCT GTTCGGCTCG 
GCCGCGGCCT ACCTGATGGG TCTGCTGTCG GACCGGTTCG GCCGCCGGCG GATGTTCCTG 
GTGCTGGCCG GCGCGGCCAT CCTGATCCAG TTCCCGGCGT TCATGGCGGT CAACACCGGC 
TCGCACTTCT GGATCATCGT GGTGATGGCG CTGGGCTTCA TCACGGCCGC CCAGGGCATC 
ACCGCGGTCA CCATGAGCTT CTTCCCGGAG ATGTTCGGCG CCCGCTACCG CTACGCCGGG 
GTCACCCTGG GCCGCGAGTT CTCCTCGATC ATCGGCGGCG GCATCGCCCC GTTGGTCGCC 
GCCGGCCTGA TGGCCTGGTT CTTCAACTCC TGGATCCCGG TCGCCGGCTA CATGGTGCTG 
ACCATGGTGG TCAGCTTCCT GGTCGCCCGC ACCGTCCCCG AGACGGTCAA CCGCGACCTG 
CAGATCCTGA CCGACGCCCG GCCCGGCGAG GCCCGCCCGG GCCTGACCGC GGCGAACGAC 
GCGGCCGCCA GCCGGGTCGC CGCCTGA

Protein sequence

MTEIAPRVGK PGEVAHADPK NVRRAAWAGL VGTALEQYDF IIYGTASALI FSKLFFPSIS 
PVAGMIAAFS AYAIGFLARP LGGLFFSHFG ERYGRKWVLV STLFLMGAAT FLIGCLPTYE 
TAGVLAPILL VLLRFLQGFG AGAEQAGGAT LLTETAPLGK RGRLASFVMV GAAFGTVLGA 
LAWVLAQLLP DDVLLSWGWR MIFWASLFVT VGAWIIRMKM AESPIFVELK KSVDVEHAAP 
LKEVAKHGTK NVLKVIFMNW GISTQSYTYQ VFMASYLITF VGVDKHFVPN VLLYGALFGS 
AAAYLMGLLS DRFGRRRMFL VLAGAAILIQ FPAFMAVNTG SHFWIIVVMA LGFITAAQGI 
TAVTMSFFPE MFGARYRYAG VTLGREFSSI IGGGIAPLVA AGLMAWFFNS WIPVAGYMVL 
TMVVSFLVAR TVPETVNRDL QILTDARPGE ARPGLTAAND AAASRVAA