Gene Namu_4005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4005
Symbol
ID	8449624
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4424410
End bp	4425738
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	71%
IMG OID	645043050
Product	major facilitator superfamily MFS_1
Protein accession	YP_003203286
Protein GI	258654130
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0701044
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCCAGG ACCTGACCAA CGCCCCGACG CCCACGTCGG CCACGGCGGG CGAGCCCGCC 
GCACCGGCGC GGATGGGCAC CTTCGCGGCC CTGCGGGTCC GCAACTACCG GCTGTTCTTC 
GCCGGCCAGA TCGTGTCCAA CACCGGCACC TGGATGCAGC GAATCGCCCA GGACTGGCTG 
GTGCTGGAGC TGACCCACTC GCCGCTGGCG GTCGGCATCA CCACCGCGCT GCAGTTCCTG 
CCGATGCTGG TGTTCGGACT GTGGGGCGGC CTGATCGCCG ATCGCTACCC CAAGCGCCGG 
CTGCTGCTGC TCACCCAGTC GTCGATGGGC GTGCTCGCCG TCCTGCTGGC CGGGCTGACC 
CTGGCCGGAG TCGTGCAGGT CTGGCAGGTG TACCTGATCG CCCTGGGCCT GGGGCTGGCC 
ACCGTGGTGG ACAACCCGAC CCGGCAGACG TTCGTCAACG AGATGGTGCC CACCCACCTG 
GTCCGCAACG CGGTCGGGCT CAACTCGGGC AACTTCCAAC TCGGCCGGAT GCTCGGCCCG 
GCAGTGGCCG GCGTGCTGAT CGCGGCGGTC GGCACCGGTT GGGCGTTCGC GTTCAACGCG 
GCCAGCTTCG CCGCCGTGCT CACCGCGCTG CTGTTGATGC GACCGGCCGA GCTGCAGCAC 
CTGCCGCACG CCGACCGGGC TCCTGGCCAG CTGCGTGAGG GGCTGCGGTA CGTGCGCAGC 
AACCCGATTC TGCTCTGGCC GATCGTGCTG GTCTTCTTCA TCGGCACGTT CGGCTACAAC 
TTCGCGATCA TCCTGTCCGC CTACACCCAG AACATCTTCC AGTCCGGTGC CGACCTGTAC 
GGGCTGCTCA ACACCGCGAT GGCCGCCGGC TCGGTGGTCG GCGCGCTCTT CGCGGCCCGG 
CGCACCTCGG CCAACCTGGC CGTGCTGTTC CTGGCCGCCG GCAGCTTCGG GCTCGGCCTG 
ATCGTGCTCG GCCTGACCCC CTGGTTCTGG CCGTTCCTGC TGCTGCTGGT CGTCGTCGGG 
TTCGTCTCGG TCACCTTCAA CACCTTGGGC AACGCCACCG TGCAGCTGTC CAGCGAGCCG 
GAGCTGCGCG GCCGGGTGAT GAGCCTGTAC ATGCTGGTCT TCATGGGCGG CACGCCGATC 
GGCGCGCCGA TCGTCGGGGC CATCACCCAG CAGTGGGGGG CGCCGGCCGC CCTGATCATC 
TCCGGGCTGA TCTGCCTGCT GGCCGCGGCC GGGGCGGCCG CGTTCGCCGC CCACTCGGCC 
GGAGTGTCGG TGCGCACCGA CCTGGCCGCC CGGGTCCGCC GCCTGGTCGC CCATCCGCAC 
CGCGCCTGA

Protein sequence

MSQDLTNAPT PTSATAGEPA APARMGTFAA LRVRNYRLFF AGQIVSNTGT WMQRIAQDWL 
VLELTHSPLA VGITTALQFL PMLVFGLWGG LIADRYPKRR LLLLTQSSMG VLAVLLAGLT 
LAGVVQVWQV YLIALGLGLA TVVDNPTRQT FVNEMVPTHL VRNAVGLNSG NFQLGRMLGP 
AVAGVLIAAV GTGWAFAFNA ASFAAVLTAL LLMRPAELQH LPHADRAPGQ LREGLRYVRS 
NPILLWPIVL VFFIGTFGYN FAIILSAYTQ NIFQSGADLY GLLNTAMAAG SVVGALFAAR 
RTSANLAVLF LAAGSFGLGL IVLGLTPWFW PFLLLLVVVG FVSVTFNTLG NATVQLSSEP 
ELRGRVMSLY MLVFMGGTPI GAPIVGAITQ QWGAPAALII SGLICLLAAA GAAAFAAHSA 
GVSVRTDLAA RVRRLVAHPH RA