Gene Namu_2508 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_2508
Symbol
ID	8448119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	2763891
End bp	2765057
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	71%
IMG OID	645041620
Product	major facilitator superfamily MFS_1
Protein accession	YP_003201864
Protein GI	258652708
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.00018254
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00122667
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATGCCAC CGGCGCGATC GAGCGTGCTG GTGCCGTCGG CGGCGCTGCT GTGGGGTCTG 
CAGGCGGCGT TCCTCACGCC CGTGCTGGCA TTGCTGCTGG TCTCGCTGTA CGACGCGACC 
ACCGTGCAGG TCGGCTGGGT CATCGCCGTC TACAACGCCA GCGGGTTCCT TGCTGCGCTG 
GTCATCCCGG CCCGCGCCGA CCGAGCGCGC CGGTACCTGC CGTCCCTGGT GGTCTGCGCG 
GCCCTCACTG CGGCACTGGC CGCCGCGCTG GCGTTGAGCA CGTCCTTGCC GATCGCCGCA 
GTGGCGCTGG CCGTGCTGGG CGGGCCGGCG AGCTCGGGGT TTTCGCTGCT GTTCGCGCAC 
CTGCGGCATT CCGGAGCGAC ACCGAATCAG GTGGTCAACA CCCGCGCCGT GGTCTCGTTC 
GCCTGGGTCG CCGGGCCGCC CATCGCCACC TTCCTGGTCG GGGCGTTCGG CGACCGCTCA 
CTGTTGGCCG CACTCGGCGT CATCGGCGTG CTCAGTGTGG CCGTCACCGC GCTGATGATG 
CGAGGAGCGG CGTCGGACCG CCTCCGACCA CCGGTCGTCG AACAGCAGAC GACGATGAGA 
CCGTCGCGGT CGACCGTCGC GGTGGTGATC GGCGCGTTCG TGGCCGTGCA AGCCGGGAAC 
GCGGCCGCCG TTGCGGTGAT GACGCTGTAC GTGACCGAAT CGCTGGGGCT CGGCGTCGTG 
TGGGCCGGCG CCGCGCTGGC CGTCGCGGCG GGGCTGGAGA TTCCTGCCCT GCTGATCATG 
GGCCGGCTGA GCCGCCGTTT CACCAGCCTG GGACTGATCA TCGCCGGTTG CCTGGCCGGC 
ATCGCCTACT GCGCGGCCAT GGCCGCGCTG TCCGGCCCCA TCGCCCTGCT GGCCGTCCAG 
GTGCTCAGTG CCTGGTTGGT CGCGGCCGTC GCCGGGATCG GCATGACCCT GTTCCAGGAC 
ATGATCCCGC AGCCGGGCCT GGCCGTCGGC ATCTACGCGA ACACCCGCCG CATCGGGGCG 
ATCGCCTCCG GGGCGATCAT CGCCTTCGGT TCCACCAGCG CCCTGGGCTA CCGCGGCGTC 
TTCGTCGCGT CGGGACTGGT CACCGCACTG GCTCTGCTCA TGCTCCTAGT GGTACGGATC 
AGACCCTCCC GCTCCGGCCA CCATTGA

Protein sequence

MMPPARSSVL VPSAALLWGL QAAFLTPVLA LLLVSLYDAT TVQVGWVIAV YNASGFLAAL 
VIPARADRAR RYLPSLVVCA ALTAALAAAL ALSTSLPIAA VALAVLGGPA SSGFSLLFAH 
LRHSGATPNQ VVNTRAVVSF AWVAGPPIAT FLVGAFGDRS LLAALGVIGV LSVAVTALMM 
RGAASDRLRP PVVEQQTTMR PSRSTVAVVI GAFVAVQAGN AAAVAVMTLY VTESLGLGVV 
WAGAALAVAA GLEIPALLIM GRLSRRFTSL GLIIAGCLAG IAYCAAMAAL SGPIALLAVQ 
VLSAWLVAAV AGIGMTLFQD MIPQPGLAVG IYANTRRIGA IASGAIIAFG STSALGYRGV 
FVASGLVTAL ALLMLLVVRI RPSRSGHH