Gene Namu_4105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4105
Symbol
ID	8449728
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	4531634
End bp	4532656
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	73%
IMG OID	645043151
Product	oxidoreductase domain protein
Protein accession	YP_003203383
Protein GI	258654227
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.416688
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0136501
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCGCT GGGGATTGAT CGGCGGCAGC GACATCGCCG CGACCCGGAT GATTCCGGCC 
CTGCGGGCCC TGGGGCAGTC CCCGGTGGCG GTGAGCAGCA GCAGCGCCGA GCGGGCCGAA 
CTGTTCGCCG GCCGGCACGA GATCGCCCAC GCCTGCCGCG ATGTCGACGA GCTACTGGCC 
CGGGACGACA TCGACGCGGT GTACATCAGC AGCCTCAACC GGTTGCACGC CGAGCACACC 
ATCGCCGCCG CGGCCGCCGG CAAGCACGTG CTGTGCGAGA AGCCGGTCGC CCTGGACGTC 
GCCGACGCCG CGGCGATGGT CGCCGCGTGC GATCGGGCCG CGGTGGTCTT CGCGGTCAAC 
CACCATCTGC CCGCGCACAC GAGCAACACC GTGATCCGCC AGCTCGTCGC CGACGGGGCT 
GTGGGCGAGG TCAGATCGAT CCGCGCGTTC TTCGCCTACG AGCTGGCCCC GCGGCTGCGC 
GGCTGGCGGT TGACCGACCC GGCGGTCGGC GGCCCGATCC TCGACCTGGT CCCGCACGTG 
GCGTCGGTGG TCAACAAGAT CGCCGGGACG CCGTCGTCGG CCGTCGCGAT CGCCGTCCGG 
CAAGGCACCT GGGACGGGCC GGCACCCGAC GGTGCGGCAC TGCCCGAGGA CACCTGCATG 
GCGGTGGTCC GCTACCCCGA CGACGTGCTC GTCCAGATCC ACGTCGGCTG GGCGACGCCG 
CATGCCCGCA ACGGTCTGGA GGTCAACGGC AGCACCGGGT CCGTCGTCGG CACCGGCGTG 
CTGTGGGCCG ACCCGATCGG CGCCGTGACC GTGGTGGACA GCGACGGGCG GCGCGAGATC 
GCGCTCGAGC AGCACGTCGA TCCGTACCAG GAAACGCTGT CGGCCTTCGC GCGGGCGGTG 
ACCGACGGCA CCCCACCGGT GGTGAGCGGC CGCGAGGCGG CCACCGCCCT GGCGCTGACC 
CTGGCGGTCC GCCGGGCCGC GGCCAGCGGG ACCACGGAGC CGGTCGAGCT CGCATCCCCC 
TGA

Protein sequence

MIRWGLIGGS DIAATRMIPA LRALGQSPVA VSSSSAERAE LFAGRHEIAH ACRDVDELLA 
RDDIDAVYIS SLNRLHAEHT IAAAAAGKHV LCEKPVALDV ADAAAMVAAC DRAAVVFAVN 
HHLPAHTSNT VIRQLVADGA VGEVRSIRAF FAYELAPRLR GWRLTDPAVG GPILDLVPHV 
ASVVNKIAGT PSSAVAIAVR QGTWDGPAPD GAALPEDTCM AVVRYPDDVL VQIHVGWATP 
HARNGLEVNG STGSVVGTGV LWADPIGAVT VVDSDGRREI ALEQHVDPYQ ETLSAFARAV 
TDGTPPVVSG REAATALALT LAVRRAAASG TTEPVELASP