Gene Namu_4309 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4309
Symbol
ID	8449935
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4790948
End bp	4791829
Gene Length	882 bp
Protein Length	293 aa
Translation table	11
GC content	77%
IMG OID	645043357
Product	1D-myo-inosityl-2-acetamido-2-deoxy-alpha-D- gluc opyranosidedeacetylase
Protein accession	YP_003203586
Protein GI	258654430
COG category	[S] Function unknown
COG ID	[COG2120] Uncharacterized proteins, LmbE homologs
TIGRFAM ID	[TIGR03445] 1D-myo-inosityl-2-acetamido-2-deoxy-alpha-D-glucopyranoside deacetylase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	0.414925
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTACGTTG CCGACGTGCC TGCCCGCCTG CTTGCCGTCC ACGCGCATCC CGACGACGAG 
TCGCTGACCA TGGCCGGCAC GCTGGCCGGG GCGGCCCTGG CCGGTGCCGA GGTCACTCTG 
GTCACCGCCA CCCTCGGCGA GGAGGGGGAG GTGATCGGCG ACGAGCTGCA GGGCCTGATC 
GCCGCCCGGG CCGACCAGCT CGGCGGGTAC CGGCTGACCG AGCTGGCGGC CGCCGGCGCG 
GCGCTGGGCG TGCGGGAACG GGTCATGCTC GGTGGGCTGG GCGCGTTCCG GGACTCCGGC 
ATGGCCGGCA CACCGTCGGC CGAGCATCCG CGGGCGTTCA TCCGGGCGCA GCGCGGCGGC 
CCCGACCATG ATCGGGCGGC CCGGGCGCTG GCCCGGGAGA TCGACCGGGT CCGCCCACAT 
GTGCTGCTCA CCTACGACGA GGACGGCGGC TACGGCCATC CCGACCACGT GGCCGTGCAT 
CAGGTCGTGC TGGCCGCGCT GCCGTTGGCC GCCTGGCCGG TGCCCCGGGT GCTGGCGGTG 
ATCCGCCCCC GGACGGTCAC CCAGGCCGAT TTCGCAGCGC TGACGACCCC GCCCGGGTAT 
CTGGCCGCGG CGGCCGACGA GGTCGGGTTC CTGGCGGCCG ACGACTCGGT CGCGGTGGCC 
GTGCCCGTCA CCGCGGCCGC CGCGCGGCGT CGCGCCGCGC TGGCCGCGCA CGCCACCCAG 
GTCGAGCTGC TGCCCGGCGA GGTGTTCGCC CTGTCCAATC GGATTGCCCA GCCGCTGCCC 
GCGGCCGAGT ACTTCCGGGT GCTGGCCGGC TCGCCGGTCC CGGTCGGGCC GGACTGGACG 
GTGCCGGCCG ACGTGGCCGC CGGGCTGGAC CTGGACCGGT GA

Protein sequence

MYVADVPARL LAVHAHPDDE SLTMAGTLAG AALAGAEVTL VTATLGEEGE VIGDELQGLI 
AARADQLGGY RLTELAAAGA ALGVRERVML GGLGAFRDSG MAGTPSAEHP RAFIRAQRGG 
PDHDRAARAL AREIDRVRPH VLLTYDEDGG YGHPDHVAVH QVVLAALPLA AWPVPRVLAV 
IRPRTVTQAD FAALTTPPGY LAAAADEVGF LAADDSVAVA VPVTAAAARR RAALAAHATQ 
VELLPGEVFA LSNRIAQPLP AAEYFRVLAG SPVPVGPDWT VPADVAAGLD LDR