Gene Namu_2939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_2939
Symbol
ID	8448552
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3217862
End bp	3219364
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	73%
IMG OID	645042024
Product	major facilitator superfamily MFS_1
Protein accession	YP_003202266
Protein GI	258653110
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.00137
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0000457887
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGACGGCAG CGGCGGCGGG GCCGGTGGGC GCGGTCGGAT TCCGGTCCGA ACGTGGGCCC 
ATCCTGGCCG CGCTGATGCT CTCGACCTCG CTGGTCGCGC TGGACTCGAC CATCGTGGCC 
ACCGCGGTGC CCTCGATCGT GGCCGACCTG GGCGGCTTCG CCGAGTTCCC CTGGCTGTTC 
TCGGTCTACC TGCTGGCCCA AGCGGTCTCG GTGCCGATCT ACGGCAAGCT CGCCGACATC 
GTCGGTCGCA AACCGGTCAT GCTGTTCGGC ATCGGGCTGT TCCTGCTCGG CTCCATCCTG 
TGCGCGGCGG CCTGGGGGAT GGTCCCGCTG ATCATCTTCC GGGCGTTGCA GGGGCTGGGC 
GCCGGCGCCG TGCAACCGAT GAGCGTCACC ATCGCCGGCG ACATCTACAC CCTGGCCGAG 
CGGGCCAAGG CGCAGGGCTA CCTGGCCAGC GTGTGGGCCA TCTCGGCAGT GGTCGGGCCG 
ACCCTGGGCG GCGTGTTCTC CGAATGGCTG ACCTGGCGGT GGCTGTTCAT CGTCAACATC 
CCGCTGTGCC TGCTCGCCGC CTGGATGTTG GCCGGCCGGT TCCAGGAGAA GGTGCACCGG 
GTCCACCACC GCATCGACTA CCTGGGCAGC GTCACCCTCA CCGTCGGCGC GACCCTGCTG 
ATCCTGGGCC TGCTGGAGGG CGGCCAGGCC TGGGCCTGGA ACTCGGTGCC CAGCATCGCC 
GTGCTGGGTG GCGGGGTCCT GCTGCTGGCG GTGTTCCTGA TCGCGCAGCG GTGGGCCGCC 
GAACCCGTGC TGCCGCTGTG GGTGTTCTCC CGGCGGGTGC TGGTGGCCAG CGCGGTGATC 
GGCGTCCTGG TCGGCGCCGT GCTGCTCGGC CTGACCACCT ACGTCCCGAC GTTCGCGCAG 
ACGGTGCTGG GCACGGGCCC GCTGGTCGCC GGATTCGCGC TGGCCGCCCT GACCATCGGC 
TGGCCGATCT CGGCGACCCT GTCCGGCCGG CTCTATCTGC GCTTGGGCTT TCGCACCACC 
GCCCTGATCG GCGCCACCCT GGCCATCGCC GGTGCGCTGC TGACCGTGCG GCTGACCGCC 
GCGTCCGCGG TCTGGCAGGT CGGCGCCTGC TGCTTCCTGA TCGGGTTGGG CATGGGCCTG 
ATCGCCAGCC CCAGCCTGAT CGCCGCGCAG TCCAGCGTCG GCTGGGCCGA GCGCGGGGTG 
GTGACCGGGA CCAATATGTT CGCCCGATCC CTCGGCAGTG CGGTCGGCGT CGCGTTCTTC 
GGCGCCCTGG CCAACGTGAG CCTGGGCGCG ACCGCCAATG CGGCCGACAA CCCGGCCGGG 
GTGGCCGCCG CGACCCATGA CGTGTTCGTG GCCATCGCCG TGCTGGCCGC CGGCCTGTTC 
GCCGCCGCCT GGCTCCTGCC GGCCGGCCGG CCCACCGCGC AGGCCGCCTC GGCGGACCCG 
TCGGCCGACC GCGCCGGCAC CGCGCCGGCC GGTGATCACA CTGCCCGCTC CGTGGCCGAT 
TGA

Protein sequence

MTAAAAGPVG AVGFRSERGP ILAALMLSTS LVALDSTIVA TAVPSIVADL GGFAEFPWLF 
SVYLLAQAVS VPIYGKLADI VGRKPVMLFG IGLFLLGSIL CAAAWGMVPL IIFRALQGLG 
AGAVQPMSVT IAGDIYTLAE RAKAQGYLAS VWAISAVVGP TLGGVFSEWL TWRWLFIVNI 
PLCLLAAWML AGRFQEKVHR VHHRIDYLGS VTLTVGATLL ILGLLEGGQA WAWNSVPSIA 
VLGGGVLLLA VFLIAQRWAA EPVLPLWVFS RRVLVASAVI GVLVGAVLLG LTTYVPTFAQ 
TVLGTGPLVA GFALAALTIG WPISATLSGR LYLRLGFRTT ALIGATLAIA GALLTVRLTA 
ASAVWQVGAC CFLIGLGMGL IASPSLIAAQ SSVGWAERGV VTGTNMFARS LGSAVGVAFF 
GALANVSLGA TANAADNPAG VAAATHDVFV AIAVLAAGLF AAAWLLPAGR PTAQAASADP 
SADRAGTAPA GDHTARSVAD