Gene Namu_2329 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_2329
Symbol
ID	8447940
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	2572118
End bp	2573659
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	73%
IMG OID	645041450
Product	major facilitator superfamily MFS_1
Protein accession	YP_003201694
Protein GI	258652538
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.00827746
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.000157522
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGGGGGAC GCCGTTGGGC TATCGGGGCT GCCGGCACGG CCGTCCTGCT GGCCGCCCTG 
GACGCGTACG TCGTCGTCGG GTTGCTGGTC GACATGGTCG TGGACCTGGG CATCCCGGTG 
AACCGGCTGG AACGGGCCAC CCCGATCGTC ACCGGTTTCC TGCTCGGGTA CGTCGCGGCC 
ATGCCGCTGC TGGGTCAGGC CTCCGACCGG TACGGCCGGC GCCGGGTGCT GCAGCTATGC 
CTGCTGGGCT TTGCCGCCGG CTCGGCCCTC ACCGCCGCGG CGGGTTCGGT GCCGTTGCTG 
GTGGCCGGTC GCGCCGTGCA GGGCATCGCC GGCGGGGCCC TGTTGCCGGT GACCATGGCC 
CTGGTCGCCG ATCTGTGGCC GGAGCGGCGC CGGGCCGGCG TCCTGGGCGC GGTCGGGGCC 
GCCCAGGAGA TCGGCAGCGT CCTGGGCACC TTGTACGGCG TCGGGGTGGC CGCCCTGTTC 
GCCTCGTGGC CGTTGTTCGC CGCGCTCCAG CCGGAGAGCT GGCGCTGGGT GTTCTGGGTC 
AACCTGCCGC TGGCCGCGAT CGCCATGCTC GTGGTGCAGC TGACCGTTCC CCGCTCCGCG 
GCGCGGCCGG GCGATCGCCC CGGCGTCGAC CTGATCGGGG GCGCGCTGCT GGCCCTGGCC 
CTTGGCCTGC TGGTGGTCGC GCTCTACAAC CCGGACCCGT CCCGATCCGT CCTGCCGTCC 
TGGGGATGGC CCGCGCTGGC CGGGGTGGCG GCGTTGGTCG TCGCCTTCGT CGCGTACGAG 
CGGCGGGCCC GAGTGCGGCT GCTGGATCCG GCGGGCGTCC GGATGGGGGC GTTGCTCACC 
GGTCTGGGGG TCAGCGCGAT CTCCGGGGCC GCCCTGATGG TCACCCTGGT CGACGTCGAG 
CTGTTCGCTC AGACGCTATT GCGCATGACC TCGGCCGAGT CGGCCCAGCT GCTGGTGCGC 
TTCCTGGTGG CGTTGCCCAT CGGGGCCCTG GTCGGCGGGC TGCTCGCCGC CCGGTGCGGT 
GAGAAGTGGG TCAGCGCGGC CGGTTTGGCT CTGGCCGCCG GCGGATTCGT CCTGATGAGC 
CGCTGGACGC CCCAGGTGCG CGAATCATCC CATCTGTTCG GAATGCCCGC GCTGGACAGT 
GATCTGGCGG TGGCCGGGTT CGGCCTCGGG CTGGTCATCG CGCCGCTGTC CGCGGTGACG 
CTGCGGGTGG TGCCGGCCCC GTCCCACGGC GTCGCCTCGG CCGCGGTGGT GGTCGCGCGG 
ATGACCGGCA TGCTGATCGG GTTGTCCGCG CTCACCGCGT TCGGGCTCTG GCGGTTCCGG 
GACCTGACCC GAGACCTGGT GCCCCCGTTG CCGATCGGGA TCACCGACGA GCAGTTCAAC 
GACCGCCTGG CCGCTTTCAG TCGGGCCCTG GAGCAGGCCC TGACCACCGA GTACCAGGAG 
ATTTTCCTGG TCACCGCCGG GCTCTGCGGG CTCGGGGTGG GGCTTTCGCT GCTGCTGCCG 
CGGCGCGATC GGGCCGCCGT CCGGTCAGGC GATCCGGCGT AG

Protein sequence

MGGRRWAIGA AGTAVLLAAL DAYVVVGLLV DMVVDLGIPV NRLERATPIV TGFLLGYVAA 
MPLLGQASDR YGRRRVLQLC LLGFAAGSAL TAAAGSVPLL VAGRAVQGIA GGALLPVTMA 
LVADLWPERR RAGVLGAVGA AQEIGSVLGT LYGVGVAALF ASWPLFAALQ PESWRWVFWV 
NLPLAAIAML VVQLTVPRSA ARPGDRPGVD LIGGALLALA LGLLVVALYN PDPSRSVLPS 
WGWPALAGVA ALVVAFVAYE RRARVRLLDP AGVRMGALLT GLGVSAISGA ALMVTLVDVE 
LFAQTLLRMT SAESAQLLVR FLVALPIGAL VGGLLAARCG EKWVSAAGLA LAAGGFVLMS 
RWTPQVRESS HLFGMPALDS DLAVAGFGLG LVIAPLSAVT LRVVPAPSHG VASAAVVVAR 
MTGMLIGLSA LTAFGLWRFR DLTRDLVPPL PIGITDEQFN DRLAAFSRAL EQALTTEYQE 
IFLVTAGLCG LGVGLSLLLP RRDRAAVRSG DPA