Gene Namu_4337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4337
Symbol
ID	8449963
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	4824619
End bp	4825725
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	69%
IMG OID	645043385
Product	extracellular solute-binding protein family 3
Protein accession	YP_003203614
Protein GI	258654458
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAGAC GCCCGCTCCT GCGGCGCCTC GCCACCGCCA CCGCACCGAT CGCCGCCGTC 
GGCGCCGCCC TGCTGCTCGC GGCGTGCTCC GGCTCGACCA CCTCCCCGTC GACCAGCTCC 
CCGTCGGCCA CGTCAGCCGG CGCCGTCTCC AGCGGCTCGG TGTCGGCGGC CGCCGACTCC 
CTCGACCTGT CCGGCGTCAC CCTGCGGATC GGCGAAACCG GTTACAAGCA GCAACAACTC 
CTGCTGGAGA AGGCGGGCCT GGCGGACACG CCCTACACCA CCGACTTCAG CCTGTTCCAG 
GGCGGCAACC TGCAACTCGA GGCGCTGGGG GCCGGCGCCA TCGACCTGGC CAGTGCCAGC 
GAGATCCCGC CGATCTTCGC CGCCCAGTCG GGTGGCCCCG GCTCCCTGGC GATCGTCGCC 
GTCCGCCAGG GCAACACGCT GACCCAGGAG GTCGTGGTTC CCGAAGGGAG TTCGATCACC 
GACGCCGCCG GCCTCAAGGG CAAGAAGGTC GCCTACGTCC AGAACACCAC GGCGCACTAC 
TTCCTGTACA AGGCCCTGGA ACAGGCCGGC CTGAGCTGGA GTGACATCGA AGCGGTCCCC 
CTGTCCACCA GCGACGGGCT GGCCGCCCTG CTGTCCGGCC AGGTGGATGC GCTGGCGTCC 
TACGGCAACG CCATCATCTC GGCCCACGCC AAGGGCGCCA GCACCATCGT CGACGCCCGG 
GACATCCTGT CCGGCAATTT CGTCTACGTC TCGACGCCGA CGGTGATCGA CGATCCGGCC 
AAGCATGCGG CCATCGCGGA CTACTTCTCC CGGCTGCAAC GGGCCTTCAA CTGGGCCCGG 
GCCAACCCGG ACACATGGGC CGCGGTCGTC GCCGAGCAGA CCAAGCAACC GGTCGAGCAG 
GCGCTGAGCA CCTTCACCGA CGGTGAGGCG CAACGTCCGA GCAAGTTCGT GCCGACCTCG 
GCCGAGGCGA TCGCCTCCCA GCAGGACGTG CTCGACACCT TCGTCAAGGC AGGCATTCTC 
ACCACCGGCT TCAGCATCGG CGACTACTGG AGCACCTCGT TCGACGCCGA CCTGACCGCG 
ATCGAGGGCG AGTATGTCGG CGGCTGA

Protein sequence

MTRRPLLRRL ATATAPIAAV GAALLLAACS GSTTSPSTSS PSATSAGAVS SGSVSAAADS 
LDLSGVTLRI GETGYKQQQL LLEKAGLADT PYTTDFSLFQ GGNLQLEALG AGAIDLASAS 
EIPPIFAAQS GGPGSLAIVA VRQGNTLTQE VVVPEGSSIT DAAGLKGKKV AYVQNTTAHY 
FLYKALEQAG LSWSDIEAVP LSTSDGLAAL LSGQVDALAS YGNAIISAHA KGASTIVDAR 
DILSGNFVYV STPTVIDDPA KHAAIADYFS RLQRAFNWAR ANPDTWAAVV AEQTKQPVEQ 
ALSTFTDGEA QRPSKFVPTS AEAIASQQDV LDTFVKAGIL TTGFSIGDYW STSFDADLTA 
IEGEYVGG