Gene Namu_0802 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_0802
Symbol
ID	8446394
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	883704
End bp	885194
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	67%
IMG OID	645039939
Product	sugar transporter
Protein accession	YP_003200202
Protein GI	258651046
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00879] MFS transporter, sugar porter (SP) family

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGAGC ACGGTGGCAG CTTCGACAGC AGCGCATCGA TCTACGACGA TTCCGACGAA 
GGCAAGGGCG TCGTCCGGAT CGCCTCGGTG GCCGCGCTCG GCGGGTTCCT GTTCGGGTAC 
GACAGCGCGG TGATCAACGG CGCCAACTCG GCCATCCAGG AATACTTCAA CGCCGGGGCG 
CTGGAGCTGG GCTTCACGGT GGCGGCCGCG CTGCTGGGCG CCGCGGCCGG TGCGCTGTTG 
GCCGGGCGGC TGGCCGACCA CATCGGCCGG CTGTCGGTGA TGCGCCTGGC CGCGGTGCTG 
TTCGCGATCA GCGCCATCGG CTGCGCGTTG GTACCCAGCC TGTGGATGCT GATCCTGTTC 
CGGTTGATCG GCGGCATCGG CGTCGGCGTC GCCTCGGTGA TCGCGCCGGC CTACATCGCC 
GAGATCGCGC CGGCCAAGAT CCGCGGCCGG CTGGGTTCGC TGCAGCAACT GGCCATCGTC 
ACCGGCATCT TCATCTCGCT GCTGGTGGAC TTCCTGCTCG CCAACGCCGC CGGCGGCTCG 
AACGCGGACT TCTGGTTCGG CTGGGAAGCC TGGCGCTGGA TGTTCTTCAT GATGATCATC 
CCCGCCCTGC TCTACGGCGG GCTGGCGTTG ACCATCCCGG AGTCGCCGCG CTACCTGATC 
GCCAAGCACC GCATTGCCGA GGCCAAGGAG GTCCTCACCG GCCTGCTCGG CCCGCGCAAC 
ATCGACGCCA AGATCGAGAA GATCCGGGCC AGCATGGAGC GCGAGACCGA ACCGTCCTGG 
AAGGACCTGA AGTCCACCAC CACCGGCCGC ATCGCCGGCA TCGTCTGGAT CGGCCTGCTG 
CTGTCGGTGT TCCAGCAGTT CGTCGGCATC AACGTGATCT TCTACTACTC CAACATCCTC 
TGGGAGGCCG TCGGCTTCAC CGAGGATCAG TCGTTCATCA TCACCGTCAT CTCGGCCACC 
ATCAACATCC TGACGACGCT GATCGCGATC GCCACCATCG ACAAGGTCGG CCGAAAACCG 
CTGCTGCTCA TCGGGTCGGT GGGCATGACG GTCACCCTGG CGACCATGGC CATCATCTTC 
GGCACCGCCG GCGAGTGCAC CCAGGTGATC GCCGACCAGT GCACCGAGGC CAACGTGGCC 
GACGGCACGC CGAACCTGTC CGTGGCCATC CTGGGCGCGG CCTCGCCGAT CGTCGCGCTC 
ATCGCGGCGA ACCTGTTCGT GGTCGCGTTC GGCATGTCCT GGGGCCCGGT GGTCTGGGTG 
CTGCTGGGCG AGATGTTCCC GAACCGGATG CGGGCCGCCG CCCTGTCGCT GGCCGCGGGC 
GGTCAGTGGG TGGCGAACTG GATCGTCACC GTCACCTTCC CGCCGCTGGC CGACATCTCG 
CTGGCGCTGG CCTACAGCCT CTACGCCGCG TTCGCCTTCC TGTCGTTCAT CTTCGTCAGC 
AAGTGGGTGC AGGAGACCAA GGGCAAGCAG TTGGAGGACA TGCACGCCTG A

Protein sequence

MGEHGGSFDS SASIYDDSDE GKGVVRIASV AALGGFLFGY DSAVINGANS AIQEYFNAGA 
LELGFTVAAA LLGAAAGALL AGRLADHIGR LSVMRLAAVL FAISAIGCAL VPSLWMLILF 
RLIGGIGVGV ASVIAPAYIA EIAPAKIRGR LGSLQQLAIV TGIFISLLVD FLLANAAGGS 
NADFWFGWEA WRWMFFMMII PALLYGGLAL TIPESPRYLI AKHRIAEAKE VLTGLLGPRN 
IDAKIEKIRA SMERETEPSW KDLKSTTTGR IAGIVWIGLL LSVFQQFVGI NVIFYYSNIL 
WEAVGFTEDQ SFIITVISAT INILTTLIAI ATIDKVGRKP LLLIGSVGMT VTLATMAIIF 
GTAGECTQVI ADQCTEANVA DGTPNLSVAI LGAASPIVAL IAANLFVVAF GMSWGPVVWV 
LLGEMFPNRM RAAALSLAAG GQWVANWIVT VTFPPLADIS LALAYSLYAA FAFLSFIFVS 
KWVQETKGKQ LEDMHA