Gene Namu_0658 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_0658
Symbol
ID	8446244
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	725300
End bp	727033
Gene Length	1734 bp
Protein Length	577 aa
Translation table	11
GC content	68%
IMG OID	645039793
Product	extracellular solute-binding protein family 5
Protein accession	YP_003200062
Protein GI	258650906
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAACGTC ATCTGTGGTT GGGGGCCGGT CTGGCCGGCG TCCTGGTGCT CGGGCTCACC 
GCCTGCGCCA GTTCGAGCCG GGACGCGGGC ACCACCACCG CGGCCAGCGG AAGTGCGCAG 
GCCTCCGGGT CGGCCGGCGA GGGCTCGGGC GGGCAGCCGG CCAACCCCGA CGGGCAGTTC 
GTCTTCGGCG CGGCCGGGGC TCCCAGCATG TTCGACCCGC TCTACGCCAC CGACGGGGAG 
ACCTTCCGGG TGGCCCGGCA GATCAACGAG GGCCTGATCC GGTTCAAGCC GGGCACCGCC 
GACCCGGAGC CGGCCCTGGC CACCGACTGG GAGCAGAGCA CCGACGGCAA GACCTGGACC 
TTCACCATCC GTGAGGGCGT CACGTTCCAC GACGGCACCC CGGTCGATGC GGCCGCGGTG 
TGCTTCAACC TCGATCGCAT GTACAACCAG ACCGGGGCCG GCGCCACCCA GGCCCAGTAC 
TGGTCGGACG TGATGGGTGG GTTCAAGAAC CAGGTCGACG ACGCCGGGCA ACCGGTCCCG 
TCGGTCTACT CCAGTTGCAC CGCCGAGGGC AACAAGGCCG TCATCGCCCT GACCACCTCG 
ACCTCGAAGT TCCCGGGGGT GCTCGGCCTG CCGTCCTACT CGATCCAGTC GCCCACCGCG 
CTGCAGCAGT ACGACGCGAA CAACGTGGTC GCCCAGGGCG ACTCGTTCGT CTACCCGGCC 
TACGCGACCG AGCACCCGAC CGGCGCCGGC CCGTACAAAT TCCAGGCCTA CGACAAGGCC 
AACAACACCG TGACCCTCGT CCGCAACGAC GATTACTACG GCGAGAAGGC CAAGACCAAG 
ACGCTGATCT TCAAGATCAT CCCGGACGAG ACCGCGCGCA AGCAGGAGCT GCAGGCCGGC 
ACCATCGACG GGTACGACTT CCCGAGCCCG GCCGACTGGG ACGGGCTGAC CGGAGCCGGC 
TTCAACGTCG AGGTCCGGCC CGCGTTCAAC GTGATGTACC TGGGCATGAC CCAGGGCACC 
AACCCCGCGC TGGCCGATCT GAAGGTGCGG CAGGCCATCG CCTACGCGCT CAACCGCGAG 
CAGTTCGTGC AGTCCCAGTT GCCCGACGGC GCCAAGGTCG CGGACATCTT CTACCCGGAC 
ACCGTCGACG GCTGGACCGA CGACGTCACC AAGTACCCGT ACGACCCGGA GAAGGCCAAG 
CAACTGCTGG CCGAGGCCGG CCAGTCGAAC CTGACGGTCA ACTTCTGGTG GCCCACCGAG 
GTCAGCCGCC CCTACATGCC GGATCCCAAG AGCGTGTTCA CCGCGTTCAA GGCGGACCTG 
GAGGCGGTCG GCATCACCGT CAACGAGATC TCCAAGCCGT GGAACGGCGG GTACCTGGAC 
GGTGTCGAGG CGCACGACGC CGACCTGTTC CTGCTCGGCT GGACGGGTGA CTACAACACG 
CCGGACAACT TCATCGGCAC CTTCTTCACC CGCACCGACA ACCGGTTCAA CACCGGCACC 
CAGCCGTGGG GCGCCACCCT GTCCGAGGCG CTCAAGCAGG CCGACGCGAT CCCGGATCCC 
GACCAGCGCA ACGCCGCCTA CGTCAAGATC AACCAGGATC TGATGGGCAC GTACCTGCCG 
GCGGTGCCGA TCTCCCACTC GCCGCCGGCG ATCGTGGTGG CCGGCGACGT CGAGGGTCTG 
GTGGCCAGCC CGCTGACCGA CGAGCGGTTC AGCACGGTCT ACAAGACGAG CTGA

Protein sequence

MKRHLWLGAG LAGVLVLGLT ACASSSRDAG TTTAASGSAQ ASGSAGEGSG GQPANPDGQF 
VFGAAGAPSM FDPLYATDGE TFRVARQINE GLIRFKPGTA DPEPALATDW EQSTDGKTWT 
FTIREGVTFH DGTPVDAAAV CFNLDRMYNQ TGAGATQAQY WSDVMGGFKN QVDDAGQPVP 
SVYSSCTAEG NKAVIALTTS TSKFPGVLGL PSYSIQSPTA LQQYDANNVV AQGDSFVYPA 
YATEHPTGAG PYKFQAYDKA NNTVTLVRND DYYGEKAKTK TLIFKIIPDE TARKQELQAG 
TIDGYDFPSP ADWDGLTGAG FNVEVRPAFN VMYLGMTQGT NPALADLKVR QAIAYALNRE 
QFVQSQLPDG AKVADIFYPD TVDGWTDDVT KYPYDPEKAK QLLAEAGQSN LTVNFWWPTE 
VSRPYMPDPK SVFTAFKADL EAVGITVNEI SKPWNGGYLD GVEAHDADLF LLGWTGDYNT 
PDNFIGTFFT RTDNRFNTGT QPWGATLSEA LKQADAIPDP DQRNAAYVKI NQDLMGTYLP 
AVPISHSPPA IVVAGDVEGL VASPLTDERF STVYKTS