Gene Namu_3811 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3811
Symbol
ID	8449430
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4182577
End bp	4183653
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	72%
IMG OID	645042861
Product	oxidoreductase domain protein
Protein accession	YP_003203097
Protein GI	258653941
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.247991
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0981542
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGATCCC CCCTTCGTAT CGCAGTGCTC GGCGGTGGCC GGATGGGCCA GAGTCACGCC 
CGCCAGATCC TGGCCAATCC CGACACCGAA CTGGTCGCGA TCATCGACCC GGCCACCGAC 
CAGCCGGCCC GGCAGTTCGG AGTCGCCCAT TTCCCGGATC ACCCGAGCCT GCTGGCGCAG 
GCCCGGCCGG ACGCGGTGAT CGTCGCCACC CCGAACGACC TGCACGTGCC GACCGCCCTG 
GACTGCCTGG CCGCCGGCGT GCCGGCGCTG GTGGAAAAGC CGGTCGGGGT GAACCCGCAG 
GAGGTCGACG AGCTCGCCGC CGCGGTTCAG ACCACCGGGG TTCCGGTCCT GGTCGGGCAC 
CACCGGCGGC ATCACCCGGT GATCGGCGCG GCCAAGCAGT ACATCGCCTC GGGCGAGCTG 
GGCCAGCTCG TCGCGATCAA CGCACTGTGG CTGACCCGCA AGCCCGCCGA CTACTTCGAT 
ACCTGGCGCT CGGCCGCCGG GGCCGGCGTT CTGCTGATCA ACCTGGTGCA CGACATCGAC 
GTGCTCCGGT ACATGTGCGG CGAGATCACC TCCGTGGTCG CCCTGACCAG CTCCGCGGCA 
CGGGGATTGG TCGTCGAGGA CACCGCCAGC CTGACCCTGC AGTTCGCCGG CGGAGCTCTA 
GGCAGCATCA TCGGCTCGGA TGCCGCGGTG GCCCCCTGGG GCTGGGACAA GAACTCCGGC 
GACGACCCCT ACTTCGCCCA GGAGCCGGAC CAACCTTGCT TCATGATCGC CGGTACCCGG 
GGCTCCATCC AGGTCCCACA GCTGGCCACC TGGTCCTACC AGGGCCAGGC CGACTGGACG 
GCCCCGCTCA CCCGCGACCA GGTGCCGTTG CCGGCCGGCG GAGCGCTGGA CCGGCAGCTC 
GCCCACTTCG TGCGGGTCGC TCGCGGGGAG GTGCCGCCGT TGGTGTCCGT GCGCGATGCC 
GGCCGCACCA TCGCGGTCGT CGATGCCTGC CACCGGGCCG CCCGGACCGG ACAGCGGGTC 
GACGTCACCG AGACCGCCGA CCGGCTGACC GCACCCCCCC TGCAGGCCGC CCGATGA

Protein sequence

MGSPLRIAVL GGGRMGQSHA RQILANPDTE LVAIIDPATD QPARQFGVAH FPDHPSLLAQ 
ARPDAVIVAT PNDLHVPTAL DCLAAGVPAL VEKPVGVNPQ EVDELAAAVQ TTGVPVLVGH 
HRRHHPVIGA AKQYIASGEL GQLVAINALW LTRKPADYFD TWRSAAGAGV LLINLVHDID 
VLRYMCGEIT SVVALTSSAA RGLVVEDTAS LTLQFAGGAL GSIIGSDAAV APWGWDKNSG 
DDPYFAQEPD QPCFMIAGTR GSIQVPQLAT WSYQGQADWT APLTRDQVPL PAGGALDRQL 
AHFVRVARGE VPPLVSVRDA GRTIAVVDAC HRAARTGQRV DVTETADRLT APPLQAAR