Gene Namu_3988 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3988
Symbol
ID	8449607
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	4404458
End bp	4405423
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	69%
IMG OID	645043033
Product	extracellular solute-binding protein family 3
Protein accession	YP_003203269
Protein GI	258654113
COG category	[E] Amino acid transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0834] ABC-type amino acid transport/signal transduction systems, periplasmic component/domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0701044
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTCC GCAGAATCGG ATCGGCGATC GCTGGCGCGG CTGCGCTGGC CCTCGTCGTC 
ACCGGCTGCA GCGGTTCGAG CACCTCTTCG GCGACCAGTG CGGCGGGCAG CGCCGCCAGC 
GCCGCCCAGA GCGCAGTCGC GTCGGCCACC TCGGCCGCGG GCAGCGCGCT GTCCTCGGCG 
CAGAGCGCGG CCAGCAGCGC GATCGCGGGC GCGACCGGAG ACTCGCAGGT GCTGACGAAC 
GCCGGCGAGG GCAAGGTGAC CGTCGGGATC AAGTTCGATC AGCCCGGCCT GGGCCTGAAG 
AACCCGGACG GCTCGTTCTC CGGCTTCGAC GTCGAGGTGG CCAAGTACGT CGCCGGCAAG 
CTGGGCGTCC CCGAGGGCGG CATCACCTTC GTGGAGTCCA AGTCGGCCGA GCGTGAGGGC 
CTGATCGACC GCGGCGAGGT CGACTACATC GTCGCCACCT ACTCGATCAC CGACGCGCGC 
AAGGAGAAGG TCAACTTCGC CGGGCCGTAC TTCATCGCCG CCCAGGATCT GCTGGTCAAG 
TCCGACAACA CCGACATCAC CGGCCCCGAG GCCATGGCCG GCAAGATCCT GTGCTCGGTG 
ACCGGTTCGA CCTCCGCCCA GAAGGTCAAG GACAACTACG CGGCGGACGT GGCCCTGCAG 
GAGTACGGCA CCTACACCGA ATGCGTCGAG GCCCTGCGGT CCGGCGCCGT CGACGCGGTG 
ACCACCGACA ACGTCATCCT GGCCGGCTAC GCCGCGCAGT ACCCGGGTGA GCTCAAAGTC 
GTCGGCAAGG GCTTCTCGAC CGAAAACTAC GGCATCGGCC TGAAGAAGGG TGACGCCGCC 
GGCACCGCGG CCATCAACGC GGCCATCGCC GCGATGATCG CCGACGGTTC CTGGAAGCAG 
GCCCTGGAGG ACACCGTCGG GCCGTCGGGC TTCACCATCC CGTCCCCGCC GACCCCCAGC 
AGCTGA

Protein sequence

MKLRRIGSAI AGAAALALVV TGCSGSSTSS ATSAAGSAAS AAQSAVASAT SAAGSALSSA 
QSAASSAIAG ATGDSQVLTN AGEGKVTVGI KFDQPGLGLK NPDGSFSGFD VEVAKYVAGK 
LGVPEGGITF VESKSAEREG LIDRGEVDYI VATYSITDAR KEKVNFAGPY FIAAQDLLVK 
SDNTDITGPE AMAGKILCSV TGSTSAQKVK DNYAADVALQ EYGTYTECVE ALRSGAVDAV 
TTDNVILAGY AAQYPGELKV VGKGFSTENY GIGLKKGDAA GTAAINAAIA AMIADGSWKQ 
ALEDTVGPSG FTIPSPPTPS S