Gene Namu_4803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4803
Symbol
ID	8450433
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	5341246
End bp	5342580
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	72%
IMG OID	645043842
Product	major facilitator superfamily MFS_1
Protein accession	YP_003204067
Protein GI	258654911
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.543727
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGCTC CCACCGCACG ACCGGGCCGC GGCCCGCTGA TCAAGGCGTA CGCGGCCAGC 
CTCACCGGCA CCGCCCTGGA GTACTACGAC TTCGCGGTCT ATTCGGCCGC CGCCGCCCTG 
GTCTTCCCGC AACTGTTCTT CCCCGGCGAG GACCCGCTCA CCGGCACCCT GCTGTCCTTC 
TCCACCTACG CGGTCGGGTT CCTGGCCCGC CCGGTCGGCG GGATCGTCTT CGGCCGGCTG 
GGTGACCGGG TCGGCCGCAA GAACGTCCTG GTCTGGACGT TGATGCTGAT CGGGGCGGCC 
ACGCTGCTGA TCGGCCTGCT GCCCGGCTAC GCCTCGATCG GGGTGGCCGC GCCGATCATC 
CTGGTCATGC TGCGCTTCGC GCAGGGCGTC GGGGTCGGCG GCGAGTGGGG CGGCGCGGTG 
CTGCTGTCCA GCGAGTACGG CGATCCGGCC AAGCGCGGCT TCTGGGCCTC GGCCGCCCAG 
ATCGGCCCGC CCGCCGGCAA CCTGCTGGCC AACGGTGTGC TGGCCGTCCT CGCCGCCGCG 
CTGACCGAGG ACGCGTTCCT GAGCTGGGGC TGGCGGGTGG CGTTCCTGAT CTCCGCGGTC 
CTGGTCGCCT TCGGCCTGTG GATCCGGCTC AAGCTGGAGG ACACCCCGGT CTTCCAGGCC 
ATCAAGGAGA GCGGCGAGCG CCCCAAGGCG CCGATCAAGG AGGTCTTCGC CACCCAGAAG 
CGGGCGCTGA CCGCCGCCGC GCTGGCCCGG GTCGGCCCGG ACGTGCTGTA CGCGCTGTTC 
ACCGTGTTCG TTGCGACCTA CGCCACCCAG GTCCTGGGCA TGACCCGCAG CCAGGTGCTC 
ACCGCCGTGC TCATCGGCTC GGCCGCCCAG CTGGGGTTGA TCCCGCTGGC CGGGGCGCTG 
TCGGACCGGA TCAACCGGCG GCTGCTCTAC GCCATCGCCG CGATCGGCTC GGCCATCTGG 
GTGCCGGTGT TCTTCCTGAT CCTGGGCCAG CCGTCGATGC CGCTGCTGAT CCTGGGGGTC 
GTCATCGGCC TGGCGTTCCA CGCCCTGATG TACGGGCCGC AGGCGGCGTA CATCGTCGAG 
CAGTTCGACA TCCACCTGCG CTACGCCGGC AGCTCGCTGG CCTACACGCT GGCCGGGGTC 
ATCGGCGGCG CCATCGCCCC GTTGGTGTTC ACCGCGCTGC TCGGCGCGTT CGGCTCCTGG 
GTGCCGATCG CGCTGTACCT TGCGGGCTGC GTCGCGGTCA CCCTGGTCGG ACTTCGCCTG 
GGCCGGGACC CGCAACCGCA GGAGGAGGAG CACGTGCTGT CCGCCGCCCA CCGTCCGGCC 
GCCACCACCT CCTGA

Protein sequence

MPAPTARPGR GPLIKAYAAS LTGTALEYYD FAVYSAAAAL VFPQLFFPGE DPLTGTLLSF 
STYAVGFLAR PVGGIVFGRL GDRVGRKNVL VWTLMLIGAA TLLIGLLPGY ASIGVAAPII 
LVMLRFAQGV GVGGEWGGAV LLSSEYGDPA KRGFWASAAQ IGPPAGNLLA NGVLAVLAAA 
LTEDAFLSWG WRVAFLISAV LVAFGLWIRL KLEDTPVFQA IKESGERPKA PIKEVFATQK 
RALTAAALAR VGPDVLYALF TVFVATYATQ VLGMTRSQVL TAVLIGSAAQ LGLIPLAGAL 
SDRINRRLLY AIAAIGSAIW VPVFFLILGQ PSMPLLILGV VIGLAFHALM YGPQAAYIVE 
QFDIHLRYAG SSLAYTLAGV IGGAIAPLVF TALLGAFGSW VPIALYLAGC VAVTLVGLRL 
GRDPQPQEEE HVLSAAHRPA ATTS