Gene Namu_1773 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1773
Symbol
ID	8447375
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	1944081
End bp	1945478
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	64%
IMG OID	645040899
Product	extracellular solute-binding protein family 1
Protein accession	YP_003201152
Protein GI	258651996
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.504545
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.290135
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAGAA CCCGTGCGGT GCGGTCGGCG TGGATCGCCG GTACCGCTGC CCTGGCCATG 
ATCCTGACGG CCTGCGGGAG CAGCAGTGAC AGCAGCAGCG CGAGCGTGTC GGTCGGCGGT 
GGCGCCGCCG CGACCGCGGT GACCGGTGAC GTCTCGGGAA GCATCGACTA CTGGTTGTGG 
GACTCCAACC AGCTGCCCGC CTACCAGGAG TGTGCCGACG CCTTCAGCAA GAAGTACCCG 
AACGCCAAGG TCAACATCAC CCAGTACGGC TGGGACGACT ACTGGGCCAA GATCAACAAC 
GGGTTCACCT CCGGCACCGG ACCGGACGTG TTCACCAACC ACCTGTCCAA GTACCCGGAG 
TTCGTGAACA AGCAGTACAT CCTCAACCTG TCCGACGCGC TCAAGGCCGA CGGCGCCGAC 
AAGGACATCT ACCAGAAGGG CCTGCTGTCG CTGTGGACCG CCCAGGACGG CGGAATCTAC 
GGCCTGCCCA AGGACTTCGA CACCATCGGC TTGTTCTACA ACGAGGACAT GATCACCGCG 
GCCGGCTACA CCGACGCGGA CCTGCAGAAC TTGACCTGGA ACACCACCGA CGGCGGCACG 
TTCGAGAAGT TCATCGCCCA CATGACCATC GATGCCAACG GGGTCCGCGG TGACGAGCCC 
GGGTTCGACA AGACCAACAT CAAGACCTAC GGATTCGGCC AGGAGAACCT GACCGACGGT 
AACGGCCAGA CCCAGTGGAG CCCGTTCACC GGCAGTAACG GCTGGACCTA CACCGACAAG 
AACCCGTGGG GCACCCAATT CAACTACGGC GACGACAAGT TCAACGAAAC GATGACCTTC 
TACAAGTCGC TGTCCGAGAA GGGCTACTCC CCGACCATCG ACAAGACCGT CGGCGTGGAC 
ACCGGAACTC AGCTCGCCGC CGGCACCTAC GCCACCATCT TCGAGGGGGA CTGGAACACC 
AGCAGCTACC TGGGCAAGGG CGTGAACCTG AAGATCGCGC CGACCCCGAT CGGCCCGAGC 
GGCGAGCGCG CCTCGATGTT CAACGGCCTG GCCGACTCGG TCAACGCCGG CACCAAGAAC 
CAGGCCGCGG CGGTCAAGTG GGTCGAGTTC ACCGGGTCCC AGGAATGCCA GGACCTCGTC 
GCCGCCAAGG CCGTCGTGTT CCCGGCCATC CCGGCCTCGA CCGACAAGGC GGAGGCCGCG 
TTCAAGGCCA AGGGCGTGGA CATGTCCGGC TTCCTGGTGC AGGTCAAGGA CGGCACCACG 
TTCCTGTTCC CGATCACCGA CCACGCCGCC GACGTCACCG CGATCATGGC CCCGGCCCTG 
CAGGGCTTCA TGAGCGGCCA GGCCGACGTC AGCTCCTTCA AGGACGCCAA CGACCAGGTC 
AACGCCCTGT TCCAGTAG

Protein sequence

MKRTRAVRSA WIAGTAALAM ILTACGSSSD SSSASVSVGG GAAATAVTGD VSGSIDYWLW 
DSNQLPAYQE CADAFSKKYP NAKVNITQYG WDDYWAKINN GFTSGTGPDV FTNHLSKYPE 
FVNKQYILNL SDALKADGAD KDIYQKGLLS LWTAQDGGIY GLPKDFDTIG LFYNEDMITA 
AGYTDADLQN LTWNTTDGGT FEKFIAHMTI DANGVRGDEP GFDKTNIKTY GFGQENLTDG 
NGQTQWSPFT GSNGWTYTDK NPWGTQFNYG DDKFNETMTF YKSLSEKGYS PTIDKTVGVD 
TGTQLAAGTY ATIFEGDWNT SSYLGKGVNL KIAPTPIGPS GERASMFNGL ADSVNAGTKN 
QAAAVKWVEF TGSQECQDLV AAKAVVFPAI PASTDKAEAA FKAKGVDMSG FLVQVKDGTT 
FLFPITDHAA DVTAIMAPAL QGFMSGQADV SSFKDANDQV NALFQ