Gene Namu_0389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_0389
Symbol
ID	8445970
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	422565
End bp	423656
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	67%
IMG OID	645039530
Product	glycoside hydrolase family 76
Protein accession	YP_003199804
Protein GI	258650648
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4833] Predicted glycosyl hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	60
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCCCG GTCGAGCCGC GAGAATGCTG GCCGTGCTAG TGGCCGGCTC GCTGCTGGTC 
GGCTGCGGCG CTCAGGCCCC CTCGGACCAG CCCGCCGTCG ATGCCCTGGT CCAGATGTAC 
GACCAGCGCT CCGGGGTGTG GCCCACCACC GGGTGGTGGA ACAGCGCGAA CGCGGTGAAC 
GCGTTGACCA ACTACATGAT CGTCTCGGGC GATCACCGCT ACACCTGGGT CCTGGAGAAC 
ACCTTCGCCA AGAAGCGCAA CGCCGCGCGC GGCAACTTCA TCAACGATTT CACCGACGAC 
ACCGGTTGGT GGGCCCTGGC CTGGATAAGC GCGTACGACC TGACCGGGAA CGCCGAGTAC 
CTACAGACCG CGCGGCGCGC CGTGGACTTC ATGTGGAGCA ATCAGGACGA CACGTGCGGC 
GGCGGTTTGT GGTGGACGGT GAATCACGGC TACAAGAATG CGATCTCCAA CGAGCTGTTC 
ATCCAGGCCG CGGCCGAGCT GGCGACGCGT CTGGGCGATG CGGGCGCGGC GTACCTCGAC 
CGGGCCCGCA CCGTCTGGGA CTGGCTCCAG GCATCCGGGA TGATCAACGA CGACCTGCTG 
GTCAACGACG GGCTCAATGC CGCCACCTGC CGCAACAATC GGGACACCAC CTGGACCTAC 
AACCAGGGCG TGATCCTGGG CGGTTTGGTC GCGCTGTTCC GGGCCACCGG CGACCACTCG 
TACCTGAAGT CGGCCCGCGA ACTGGCCGAC GCCTCCACCC GGGCTCCCGG GCTGCACGTC 
GACGGCGTGC TCACCGAACC CTGCGAGCGA ACCGGCTGTG ACGTGAACGG TCCCAGCTTC 
AAGGGCATCT ACGTCCGCAA CCTCGGCGAA CTCAACCGCG TCCTGGACGA CCACCCCTAC 
AGCGACTACC TGATCGACCA GGCGTCGACC GCCTACGACC ACAACCGCAC CGACGACAAC 
GAGTACGGCT TGCACTGGGC CGGGCCGGTT GATCGCGTCA ACGGGGCAAC CCAACAGAGC 
GCGGTCGACC TGCTGGTCGC CGCCCAACCG ATCCCGGAGA CCCCCGAGAG CGCCGTCAGC 
ACGTCGGGAT AA

Protein sequence

MRPGRAARML AVLVAGSLLV GCGAQAPSDQ PAVDALVQMY DQRSGVWPTT GWWNSANAVN 
ALTNYMIVSG DHRYTWVLEN TFAKKRNAAR GNFINDFTDD TGWWALAWIS AYDLTGNAEY 
LQTARRAVDF MWSNQDDTCG GGLWWTVNHG YKNAISNELF IQAAAELATR LGDAGAAYLD 
RARTVWDWLQ ASGMINDDLL VNDGLNAATC RNNRDTTWTY NQGVILGGLV ALFRATGDHS 
YLKSARELAD ASTRAPGLHV DGVLTEPCER TGCDVNGPSF KGIYVRNLGE LNRVLDDHPY 
SDYLIDQAST AYDHNRTDDN EYGLHWAGPV DRVNGATQQS AVDLLVAAQP IPETPESAVS 
TSG