Gene Namu_3871 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3871
Symbol
ID	8449490
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4244265
End bp	4245566
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	69%
IMG OID	645042919
Product	major facilitator superfamily MFS_1
Protein accession	YP_003203155
Protein GI	258653999
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0205552
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGCGCC GCGGGCGCGC CGGGATCGTC ATGACCCTGG AGGTCAAGGT CGGGCGGCAC 
CGGCGCTCCG AACCGACCCA GCTGCGGCAC AACCGCACCT ACCTGTTGCT GTGGACCGGC 
GCGGGCGTGT CCATGCTCGG CTCCCGGATG AGTGCGATCG CCTACAGCCT GGTCGTGCTC 
TGGGCGACCG ACTCGGCGAC CAGTACCGCG ATGGTGACCT TCGCCGCCCT GTTGCCGTTC 
CTGGTGACCC AGCTGCCAGC CGGGGTGCTG GTCGACCGGT TGGACCGGCG GCGGGTGATG 
ATCGGCTGCG ACCTGGGCCG GGTGCTGCTG ATCGGTATCG CCCTGACCAC TGTGGCCATG 
GGCCACGTCT GGGTGCCGCT GCTGATGGTG ATCGCCTTCT GCGAAGGCAG TCTCACCGAG 
ATGTACTCGA TCGCGGAGCG GGCCGCGGTG TTCACGGTGG TGCCGGACGA GCAGCTGGGG 
GTGGCCGTCG GGGCCAACGA GGCGCGGTCC GAGGCGGCCG GCCTGATCGG TCAGCCGATC 
GGCACCTTCC TGTTCAGCGC GCTGCGCTGG CTGCCGTTCG CGGCCACCAT CGTCTCGCAC 
CTGCTGTCCC TGTTCACCCT GCTGCTGATC CGGCGTCCGT TGCAGGGACC GCGGCCCGAC 
GGTCCCCGGC CGAGCCCGGT TCAGGACGTC AAGGAGGGCT TCGACTTCGT CCGGTCGCAG 
ACCTACCTGC GCCGCGCGCT CGGCCTGATC GCGGCGAGCA ACCTGCTGTT CCAGGTGCTG 
GCCCTGGGCC TGCTGGTGAT CGTCAAGGAC CAGGGCGGCG GTCCGGACAC CATCGGCTGG 
ATCCTGCTGG CCAGCGGGAT CGGCGGAATG CTGGGCGCCC TGTCCAGCAA CCTGTTCATG 
CGTTGGGTCG GGGTCCGGTG GATCTTCATG GGCGTCAACA TCTTCTGGAC CCTGTTGATG 
GGCAGCATGG TGTTCTTCCA GCAGCCGCTG GCCCTCGGCG TGATCTTCAG CCTGCTGCTG 
TTCGGGGCCG GGCTGGCCAA TGTGGCCGGC ATCGTCTACA CGATGAAGGT GGCCCCGGAG 
GACATGCAGG GGCGCATCGG CTCCATCGTG TCGCTGCTGT CCTCGGGGGC GAACGCGTTG 
GGCGCGTTGT GCGCCGGGGC CATCCTGGAC GCGCTCGGGG TGCGCACCAC GATGATCATC 
GTGGGTTGCT CGATGCTGGT CATCGCCATC GCGGCCGTCC TGGCCTTCGG TGGCCGCAAG 
GCGGCGGCCG CCGAGGCCGC GCTCGGCGAT CTGACCGAGT AG

Protein sequence

MVRRGRAGIV MTLEVKVGRH RRSEPTQLRH NRTYLLLWTG AGVSMLGSRM SAIAYSLVVL 
WATDSATSTA MVTFAALLPF LVTQLPAGVL VDRLDRRRVM IGCDLGRVLL IGIALTTVAM 
GHVWVPLLMV IAFCEGSLTE MYSIAERAAV FTVVPDEQLG VAVGANEARS EAAGLIGQPI 
GTFLFSALRW LPFAATIVSH LLSLFTLLLI RRPLQGPRPD GPRPSPVQDV KEGFDFVRSQ 
TYLRRALGLI AASNLLFQVL ALGLLVIVKD QGGGPDTIGW ILLASGIGGM LGALSSNLFM 
RWVGVRWIFM GVNIFWTLLM GSMVFFQQPL ALGVIFSLLL FGAGLANVAG IVYTMKVAPE 
DMQGRIGSIV SLLSSGANAL GALCAGAILD ALGVRTTMII VGCSMLVIAI AAVLAFGGRK 
AAAAEAALGD LTE