Gene Namu_0143 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_0143
Symbol
ID	8445723
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	155676
End bp	156896
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	73%
IMG OID	645039290
Product	major facilitator superfamily MFS_1
Protein accession	YP_003199565
Protein GI	258650409
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	78
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGCGG GACTCATCGC CCTCGCGCTC GGCGGCTTCG GGATCGGCCT GACCGAATTC 
ACCATCATGG GTCTGCTGCC CGAGGTCGCG GCCGACTTCG GCGTCAGCGA GGCGGCGGCG 
GGCTGGCTCA TCACCGGGTA CGCCCTGGCG GTGATCGTCG GGGCGCTCGG GCTGACCGCC 
GCGACCACCC GGCTGCCTCG CAAACGGGTG CTGCTCGGAC TGCTCGTGCT GTTCGTCATC 
GGCAACGCCA TCAGTGCGCT GGCCCCCACC TACTCGGTGA TGATGGCCGG CCGGATCGTC 
GCGGCGCTGT GCCACGGCGC CTTCTTCGGC ATCGGCGCGG TCGTCGCGGC CGATCTGGTT 
GCCCCCGCCC GCAAGGCCGG GGCGGTGGCC ATCATGTTCA CCGGGCTGAC CGCGGCGAAC 
GTTCTCGGCG TCCCCCTGGG CACCTTCATC GGCCAGCAGT TCGGCTGGCG GGCCACGTTC 
TGGTCGATCA CCGTCATCGG CCTGGTCGCC TTCGTCGGCG TGCTCGCCCT GGTACCGCAG 
GATCGCGGCC GGCACGTGCC TACCCGCCTG CGGGACGAGG TCGGCGCGCT GCGCGACCGG 
CAGGTGTGGC TGTCGATGGC GGTGACCGTG CTCGGCTTCG GCGGCATGTT CGGGGCGTTC 
ACCTACATCG CCTACACGCT CACCGAGGTG ACCGGGTTCG CGTCGTCGAC GGTGCCGTGG 
CTGCTGGTGC TGTTCGGGGC CGGCCTGCTC GTCGGCAATG TGCTGGGCGG CCGGTTCGCC 
GACCGCGCGC TGGACCGCAG CCTGATCGTC ATCCTCGCCG GGCTGGTGCT GGTCCTGGTC 
GGGTTCGCGC TGGCCGCGAC GAGCCCGTGG GGCACCGTGG TGATGATCTT CCTGATGGGC 
GGGTTCGGCT TCGCCACCGT GCCCGGCCTG CAGACCCGCG TGATGACCTA CGCCGCGCAG 
GCACCGTCGC TGGCCTCGGC CGGCAACATC GCCGCGTTCA ACCTCGGCAA CGCCCTGGGT 
GCGCTGGCCG GCGGCCTGAC CATCGGAGCC GGACTGGGCT ACACCTCACC GATCTGGGCC 
GGCGCCGCGA TCACCGCGGC CGCGCTGGTG GTGATGGTGG TCGCCGCCCG GACCGCGCCC 
CGACCGGTGC CGGCGCTCAC CGCGCCGGCA CCCGTCCCCG CCGCGACGGC GCCGGTCGGG 
ACCGAGGACC GCAGCAGGTA G

Protein sequence

MPAGLIALAL GGFGIGLTEF TIMGLLPEVA ADFGVSEAAA GWLITGYALA VIVGALGLTA 
ATTRLPRKRV LLGLLVLFVI GNAISALAPT YSVMMAGRIV AALCHGAFFG IGAVVAADLV 
APARKAGAVA IMFTGLTAAN VLGVPLGTFI GQQFGWRATF WSITVIGLVA FVGVLALVPQ 
DRGRHVPTRL RDEVGALRDR QVWLSMAVTV LGFGGMFGAF TYIAYTLTEV TGFASSTVPW 
LLVLFGAGLL VGNVLGGRFA DRALDRSLIV ILAGLVLVLV GFALAATSPW GTVVMIFLMG 
GFGFATVPGL QTRVMTYAAQ APSLASAGNI AAFNLGNALG ALAGGLTIGA GLGYTSPIWA 
GAAITAAALV VMVVAARTAP RPVPALTAPA PVPAATAPVG TEDRSR