Gene Namu_3098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3098
Symbol
ID	8448712
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3419124
End bp	3420125
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	77%
IMG OID	645042179
Product	thioredoxin
Protein accession	YP_003202420
Protein GI	258653264
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG3118] Thioredoxin domain-containing protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00000000032408
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000022841
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCCGCC CCACCCCCCG ACCGCAGCCG CCGGCGGCGA TGAGCGCCGC GTTCGCCGGC 
GCGGTCGACC TGTCCGCCCT CAAGAGCCGG GCGGCCGGCC CGGCCGGACC CGGCGCCGCC 
GGACCCGCGG CTCCCGGGGC ACCTGCCGGT GCCCCCGCGG CCGGGACGGG GGAGCCCTCG 
CCCTACATCG TCGACGTCGA CGAGCCCACG TTCGGCAGCC TGGTCCAGGC CTCCACCCAG 
CTGCCGATCA TCCTGAACTT CGAGGCCGCC TGGGCCGAAC CGAGCCTGGC GCTCTCGGCC 
GCCCTGAGCA AGCTGGCGGC GGCCGGCGGC GGGGCCTGGA TCCTGGGTCG GGTCGATGTC 
GACGCCAACC CGCGGATCGC CCAGGCCCTG CAGGTGCAGA CGCTGCCGTT GGCGGTCGTC 
CTGGTGCAGG GTCAGCCGGC CGCCGAGGTG CCCGGGGTCG CGTCCGAACC GCAGCTGCGG 
CAGTGGATCG CCTCGCTGCT CGATCAGCTG CGCGAGCACC TGCCGGGCAT CGCCCAGGCC 
GAGGCCCGGC TGGCCGCCGA GGGTGGCGGC GCGCAGGAGG AGCCGGAGCC CGAGGATCCG 
CGGTTCGTCG CCGCGGAGGA GGCGCTGGCC GAAGGGGACT ACGCGGCCGC CGAACTGGCC 
TACCAGCAGA TCCTGGCGGT GGAGCCGGCC AACGCCGAGG CCAAGGCGGC GCTGGCCCAG 
GTCGGTCTGC TCGCCCGGGT GGACAGCCTG CCGCCGGATG CGATCGCCGC CGCGGATGCC 
GCGCCCGACG ACGTCGAGCT GCAGAAGGGC GCCGCCGACG CCGAGTTGGC CGCGGGGCAG 
GCCGGGGCGG CCTTCGCTCG ACTGATCGCC ACGGTTCGCC GGACCGCCGG GGACGAGCGG 
ACCGCCGCCC GCGAGCACCT GGTCGAGCTG TTCGGCCTGT TCGCGCCGGA CGATCCCGAA 
GTGATCAAGG CCCGGCGCGC ACTGGCCGCC GCCCTGTACT GA

Protein sequence

MTRPTPRPQP PAAMSAAFAG AVDLSALKSR AAGPAGPGAA GPAAPGAPAG APAAGTGEPS 
PYIVDVDEPT FGSLVQASTQ LPIILNFEAA WAEPSLALSA ALSKLAAAGG GAWILGRVDV 
DANPRIAQAL QVQTLPLAVV LVQGQPAAEV PGVASEPQLR QWIASLLDQL REHLPGIAQA 
EARLAAEGGG AQEEPEPEDP RFVAAEEALA EGDYAAAELA YQQILAVEPA NAEAKAALAQ 
VGLLARVDSL PPDAIAAADA APDDVELQKG AADAELAAGQ AGAAFARLIA TVRRTAGDER 
TAAREHLVEL FGLFAPDDPE VIKARRALAA ALY