Gene Namu_1840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1840
Symbol
ID	8447445
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	2023138
End bp	2024742
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	68%
IMG OID	645040969
Product	GMC oxidoreductase
Protein accession	YP_003201219
Protein GI	258652063
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.000489986
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.328535
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCGAAT CCACCGACCA CGGCTCCACC GACTACGACT CCACCGATTA CGACTCCACC 
GATTACGACG TTGTCATCAT CGGTTCCGGC GCCGGGGGCG GCACGCTCGC CCACCGGCTG 
GCGCCCTCCG GCAAGCGGAT CCTGATCCTG GAGCGGGGTG ACTGGCTGCC CCGGGAGGTG 
CAGAACTGGG ATGCCACCGC GGTCTTCGTC GACAACCGGT ACGTCTCGGC CGACACCTGG 
TACGACGCCG ACGGTAAGTC CTTCCAGCCG CAGATCCACT ACAACGTCGG CGGCGCCACC 
AAGCTTTACG GCGCGGCGCT GTACCGGTTG CGGGAGAAGG ACTTCGGCGA ACTCATCCAC 
TTCGACGGGA TCTCCCCCGC GTGGCCGGTG AGCTACGCCG ACTTCGAGCC GTACTACGCG 
CAGGCCGAGC AGCTCTACCA GGTGCACGGG CAGCGGGGCG AGGATCCCAC CGAACCACCG 
AGTTCGGGAC CGTATCTTTT TCCGGCGGTC TCGCACGAGG CGCGGATCCA GCAGCTGTAC 
GACGATCTGC GGGCCAGCGG GCTGCATCCG TTCCACGCCC CGGCCGGCAT CATGCTCAAC 
GAGGCGGACA TGGCCTACAG CCGGTGCATC CGCTGCGCCA CCTGCGACGG TTTCCCGTGC 
CTGGTGCACG CCAAGTCCGA CGCCGAGGTG GTCGCGGTCC GCCCGGCCCT GACGCACCCT 
AACGTCACGC TGATCCGCGG CGCCGAGGTG ATCCGGCTGG ACACCGACCT GACCGGACGC 
TCGGTCACCG ACGTGGTGGC CATGATCGGC GGCGAGCGGC ACCGCTTCCA CGGTTCGATC 
GTGGTGGTCA GCGCCGGCGC GGCCAACTCG GCCAAGCTGT TGCTGCGCAG CGCCTCCGAC 
CGGCATCCGA ACGGGCTGGC CAACGGTTCG GACCAGGTCG GGCGCAACTA CGTCTTCCAC 
AACAGCCGGG CGTTCCTGGC CGTGTCGACC GAGCGCAACG ACACCCGCTT CCAGAAGACC 
CTGGGGGTCA ACGACTTCTA CTTCGGCGAC GACGAGTTCG ACTACCCGAT GGGCAACATC 
CAGATGGTCG GCAAGAGCTC GGCGCCGATG TACCGGGGCG AGAAGCCACT GGAGACCGCC 
CTGGCCCCCT CCTTCGCCCT GTCCGACGTG GCCGTGCACG CGGTGGATTT CTGGCTGTCC 
ACCGAGGATC TGCCTCGGCC GGAGAACCGG GTCACGCTGG CCGCCGACGG GAACATCACC 
CTGTCCTACA CGCCGAACAA CACCAAGCCG CTGGACGAGC TCTACCACCG GATCAAGCGC 
CGGCTGAGCC ATCTCGGGCT GAACCCGCAT CACCTGATCC CGCGTTCGGC CTACATGAAG 
AACGACATCC CGATCGCCGG GGTGGCCCAC CAGGCCGGTA CCTGCCGTTT CGGCAGCGAT 
CCGGCCGACT CGGTGCTGGA CACCGACTGC AAGGCCCACG AGCTGGACAA CCTGTACGTG 
GTGGACACCA GCTTCTTTCC CTCGATCGGT GCGGTGAACC CGGCGCTGAC CGCGGCGGCC 
AACGCGTTGC GGGTGGGCGA CCACCTGCTG GACCGGCTGG GCTGA

Protein sequence

MPESTDHGST DYDSTDYDST DYDVVIIGSG AGGGTLAHRL APSGKRILIL ERGDWLPREV 
QNWDATAVFV DNRYVSADTW YDADGKSFQP QIHYNVGGAT KLYGAALYRL REKDFGELIH 
FDGISPAWPV SYADFEPYYA QAEQLYQVHG QRGEDPTEPP SSGPYLFPAV SHEARIQQLY 
DDLRASGLHP FHAPAGIMLN EADMAYSRCI RCATCDGFPC LVHAKSDAEV VAVRPALTHP 
NVTLIRGAEV IRLDTDLTGR SVTDVVAMIG GERHRFHGSI VVVSAGAANS AKLLLRSASD 
RHPNGLANGS DQVGRNYVFH NSRAFLAVST ERNDTRFQKT LGVNDFYFGD DEFDYPMGNI 
QMVGKSSAPM YRGEKPLETA LAPSFALSDV AVHAVDFWLS TEDLPRPENR VTLAADGNIT 
LSYTPNNTKP LDELYHRIKR RLSHLGLNPH HLIPRSAYMK NDIPIAGVAH QAGTCRFGSD 
PADSVLDTDC KAHELDNLYV VDTSFFPSIG AVNPALTAAA NALRVGDHLL DRLG