Gene Namu_3831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3831
Symbol
ID	8449450
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4206114
End bp	4207310
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	78%
IMG OID	645042881
Product	major facilitator superfamily MFS_1
Protein accession	YP_003203117
Protein GI	258653961
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.135932
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0769479
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGTCCG ACCCTGCCCG GCGCCCGGTC GATCGGCGCC GACCCGGAGC CGGGCTGTCG 
GCGGTGCTGG CCCTGCTGCT GGCCACCGGC TGGGCGGCCA ACCATTTTGC CGCGCTGCTG 
CCGGTGCTGC GCACGTCGCA GAACCTGTCC GCCGCGCTGG TGGCCGGCCT GTACGGGCTG 
TACGCCGTCG GGCTGTTGCC GGGTCTGCTG CTCGGCGGCT CGGCCTCGGA CCGGTTCGGG 
CGCCGTGCCG TGGCCGTGCC CGGGGCGCTG CTGGCCGCGA TCGGCACGCT GATCCTGTTG 
TTCTGGCACG ACCCGACCGG GCTGGTCGTG GGCCGGCTGG TGGTCGGCGC CGGGGCCGGC 
GCGACGTTCA GCGCCGGCAC CGCCTGGGCC GCCGACCTCG GTGGGGCGGC CGGGGTCACC 
CGGGCCGGGG TGTTCCTGAC GCTGGGCTTC GCCACCGGCC CGGTGGTTTC CGGGGTGCTG 
GCCGAGTTCG CGCCGGCGCC GCTGGTCGTC CCGTTCGTGC TCAGCGCGGT GCTCTCGGTG 
GCCGCGGTGG CGGCCGCCGC CCTGGTCCCG GGCCGGCCGC CGCACCCGCC GCCGCACGCG 
GTGTCGACGG CCGGCCGGAC CCCTTGGGTG CCCGACCGGC GGCGCTCCGC CGGCACCGCC 
CTGGCCTGGG CCTTGCCGGT CGCGCCGTGG GTGTTCGCCG GGGCCACGGT CGGGGTGGTC 
ACCCTGCCGT CCCGATTGCC GGCCGGATCC GGGGGACCGT TGCTGGCCGG GATCGCCGCC 
GGAGTGGTAC TGGGCACCGG GGTGGTCGTC CAGACGATCG CCCGCCGGCG CAACGTCGGT 
CCCGGCGCGG GCGTGCTCGG TGCGGTCGCC GCCGCGGCCG GATTGGTCCT CGCGGCCATC 
GGTGGCGCCC AGCCCGGCCT GGTGCTGGTC GCGGTGGCGT TCCTGCTGCT GGGCACCGGG 
TACGGGCTGT GCCTGCGGGC CGGCCTGCTG GACCTGGAGC GCTGGGCGCC GCCGGCCGCC 
CGCGGCAGCC TGACCGGCGT GTTCTACCTG GCCACCTACA GCGGCTTCGC CGTCCCGGTG 
GTGCTGGCCG CGCTCGATCC GGTGGCCGGC CCCACCGTCC CGCTGCTCGT GCTGGGCGCG 
TTGGCGGCCC TGGTCGCGGT GCTGCGATGG CTGCGAATCG TCGGGGAGCG GGCCTGA

Protein sequence

MPSDPARRPV DRRRPGAGLS AVLALLLATG WAANHFAALL PVLRTSQNLS AALVAGLYGL 
YAVGLLPGLL LGGSASDRFG RRAVAVPGAL LAAIGTLILL FWHDPTGLVV GRLVVGAGAG 
ATFSAGTAWA ADLGGAAGVT RAGVFLTLGF ATGPVVSGVL AEFAPAPLVV PFVLSAVLSV 
AAVAAAALVP GRPPHPPPHA VSTAGRTPWV PDRRRSAGTA LAWALPVAPW VFAGATVGVV 
TLPSRLPAGS GGPLLAGIAA GVVLGTGVVV QTIARRRNVG PGAGVLGAVA AAAGLVLAAI 
GGAQPGLVLV AVAFLLLGTG YGLCLRAGLL DLERWAPPAA RGSLTGVFYL ATYSGFAVPV 
VLAALDPVAG PTVPLLVLGA LAALVAVLRW LRIVGERA