Gene Namu_3848 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3848
Symbol
ID	8449467
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	4219675
End bp	4220637
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	63%
IMG OID	645042897
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_003203133
Protein GI	258653977
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1175] ABC-type sugar transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.0230008
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.429544
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCAGA CAATCGGGGC TGCCCACCCC GAACCACCCA CCATCGATCA GCTCGGCCGG 
CTTTCCTTCC GGCAGCGGCG CTTCACCAAA AGCCGCCAGT CGCAACGGAT CGCCGCTGCC 
TGGATGGTCA CCCCGGCCGC GGCCCTGATG CTGGTCTTCA TCATCATCCC GATCGTGCTG 
ACCTTCGTGT TGGCGTTCAC CAACGCCAAG CTCATCTCGC CGACCGGTCC CCGGTTCGTC 
GGATTCGACA ACTTCGCCCG GCTGTTCGGC GATCCGATCT TCTGGAAGTC GTTGCGCAAC 
ACCCTGTTGT TCGCCGTGTT CGTGGTGCCG ATCCAGGCCG GCCTGGCCCT GGTGCTGGCG 
CTGCTGATCA ACGTCAAGAT CCGCGGGGTC AACTTCTTTC GCACCGTGTA CTTCCTGCCG 
GTGGTCACCT CCATGGTGGT GGTGTCGCTG CTGTGGAAGT TCCTCTACCA ACCCGACGGC 
CTGATCAACA ACTTCCTGGC CGTCTTCGGT ATCGACGGTC CGGACTGGCT GGGTAATCCG 
AACACCGCGA TGATCTCGAT CCTGATCATG TCGGTGTGGC AGGGAGTCGG GTTCCACATG 
GTCATCTGGC TGTCCGGCCT GCAGACCATC CCGCAGGACA TGTACGAAGC CGGGGCCATC 
GACGGAGCCA ACAACTGGCA GCGCTTCCGC TACCTGACCT GGCCGGCCCT GCGCCAGACC 
CGCACCTTCA TCCTGATCAC GATCACCATC CAGGCCTTCG CCCTGTTCAC CCAGATCCAG 
GTGATGACCG AGGGCGGCCC GTTGGACTCG ACCTCGACGA TCGTCTTCCA GGCCGTGCGC 
ACCGGATTCG ACCTGCAGCA GACCGGCTAC GCCTCGGCGC TGTCGCTGGT CTTCTTCATC 
CTGGTGCTGG TGGTTTCCCT GGTCCAACGC TTCCTGACCC GCGACAAGGA CGTGAAGAAA 
TGA

Protein sequence

MTQTIGAAHP EPPTIDQLGR LSFRQRRFTK SRQSQRIAAA WMVTPAAALM LVFIIIPIVL 
TFVLAFTNAK LISPTGPRFV GFDNFARLFG DPIFWKSLRN TLLFAVFVVP IQAGLALVLA 
LLINVKIRGV NFFRTVYFLP VVTSMVVVSL LWKFLYQPDG LINNFLAVFG IDGPDWLGNP 
NTAMISILIM SVWQGVGFHM VIWLSGLQTI PQDMYEAGAI DGANNWQRFR YLTWPALRQT 
RTFILITITI QAFALFTQIQ VMTEGGPLDS TSTIVFQAVR TGFDLQQTGY ASALSLVFFI 
LVLVVSLVQR FLTRDKDVKK