Gene Namu_5044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_5044
Symbol
ID	8450675
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	5628023
End bp	5629354
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	77%
IMG OID	645044080
Product	major facilitator superfamily MFS_1
Protein accession	YP_003204304
Protein GI	258655148
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	53
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCCGC CACCGGCTCC GCGACCGACC TACCGCTCCG CGCTGCGCAC CCGGCCGTTC 
CGGCGGCTGC TGGCCGGGCA CGGCCTGGGC ACGATCGCCC AGCTGATGCT CACCCTGGCC 
GTGGGCATCG AGGTCCTGGA GCGGACCGGC TCGGGTTGGT GGGTGTCGGT GACGGTCGCC 
CTCGGCTTCG TGCCGTACGT GCTGGCCTCG GGCTACGCCG GCCTGCTGGC CGACCGGCAC 
TCGCGCAGCA CCGTGCTCAC CCTGTCCTTC TCCACCCGGG CCGGCTGCGC GGCCGTGCTC 
GTCGCCGGTC TGGCCCTGCA CGGGCCGATC GCGCTGCTGG TGACGGTGGC CGCGGTGGCC 
GCCGTGCTGG CCACCCCGTC CTACCCAGCG CTGGCCGCGG CCACCGTCCA GTGCGTGCCG 
GACGAGCAGC TGCCGCCGGC GAACGCCCTG GTCACCGGGG TGGAGAACGT GACCTGGATG 
GCCGGGCCGG GCGTGCTCGG GCTGCTGCTG CTGATCGGCG CCGGCCCCAC CGTCGGCACC 
GCGACCGCGG CCGGGCTGTT CGTGCTCGCC GCGGCCCTGT CGGCCGCGGC CCGGCTGCCC 
GCCCCGGCTC GTCCGGACGC CGCGCCGGGG GTGCTGGCCG AGCTGCGCGC GGGACTGAGC 
GCGGTGGCGC GGGTCGCCGC CGTGCGCCGG CCGATGACCG TGGCGGTGAT CGACAACTTC 
CTCTACGGCT ACCTGGTGGT GGCCATGGTG CTGTTGGCCG CCGAGGTCTT CGCCGGTGAC 
GGCGGCGGCG ATGGCGCCGA CAACCGGGCG ATCGGGCTGT TGAACGCGGC CCTGTCGGTC 
GGCGGGGTGC TCGCCCTGCT GCCCATCAAC CTGCTGGCCG CGCGGTTCCG GCCGGCCCGT 
CTGCTGCTGG TCACCATGAC CGGGTTCGGT GCGGTCACCG TGCTGCTGGG CCTGTCCGGC 
GCGATCGGCG CACCCGTCGG GCTGGCCATG GGCCTGGTGG CCGTCGCCGG CGCCGGATCC 
CTGATCGCCG AGGTGACCGC GGTGACGCTG CTGCAACGGG CCGCGCCGGA CGAGCTGACC 
GCCCGCGTGT TCGGCGTCTA CGACCAGCTC AACGTCGGTG CCCTGGCCCT GGGGTCGCTG 
CTGGCCGGCC CGCTGGCCGC GGCGATCGGC GCCGGACCGG CGATGGTCGC CGTCGCGTCG 
ACCTGCCTGG CGCTGGCCGC CGTGGCCACC GGCCGGCTGC GGGAACCGGC CCGCCGGGGC 
CGGCACGCGG CCGCCGGTCC CGGGCGAGCG AGCCTCAGCC CGCCGGTGGG ATCGCTGGGT 
CCGACGGGGT GA

Protein sequence

MSPPPAPRPT YRSALRTRPF RRLLAGHGLG TIAQLMLTLA VGIEVLERTG SGWWVSVTVA 
LGFVPYVLAS GYAGLLADRH SRSTVLTLSF STRAGCAAVL VAGLALHGPI ALLVTVAAVA 
AVLATPSYPA LAAATVQCVP DEQLPPANAL VTGVENVTWM AGPGVLGLLL LIGAGPTVGT 
ATAAGLFVLA AALSAAARLP APARPDAAPG VLAELRAGLS AVARVAAVRR PMTVAVIDNF 
LYGYLVVAMV LLAAEVFAGD GGGDGADNRA IGLLNAALSV GGVLALLPIN LLAARFRPAR 
LLLVTMTGFG AVTVLLGLSG AIGAPVGLAM GLVAVAGAGS LIAEVTAVTL LQRAAPDELT 
ARVFGVYDQL NVGALALGSL LAGPLAAAIG AGPAMVAVAS TCLALAAVAT GRLREPARRG 
RHAAAGPGRA SLSPPVGSLG PTG