Gene Namu_3887 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3887
Symbol
ID	8449506
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	4287505
End bp	4289505
Gene Length	2001 bp
Protein Length	666 aa
Translation table	11
GC content	73%
IMG OID	645042935
Product	transcriptional regulator, SARP family
Protein accession	YP_003203171
Protein GI	258654015
COG category	[T] Signal transduction mechanisms
COG ID	[COG3629] DNA-binding transcriptional activator of the SARP family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.000943372
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.402378
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGGAA CCCGCTCGGA ATTGTTCGCG ATTATCGGCA ATGATCTCGA GAGCGGCCGT 
TCCGGGTCCG GTCTCGAACC GACGCGCCGG GACGACAGCA ATCCGAGATC CGTCCTGCAA 
TTCCGCATCC TCGGCCCCGT CCAGGTCTTC TGCCACGGCA GCGAGGTCCA GCTGGGGGGC 
TCGAAGCAAC GCACGGTGCT GGCCACCCTG CTGCTGGCCC GGGGCCGGGT GGTCACCGAC 
GCGGCCCTGA GCACGGTGTT GTGGGGTGAG GATCCGCCGC GGACCTCCAG CGCGCAGATC 
TACACCTACG TCTCCCGGTT GCGCCGCAGT CTGGGCGAAC AGGTCGAGCT GGTGCGCAGC 
GGCCAGGGCT ACGCGCTGCG GGCGCCGCAC GCCTGGTTCG ACCTCGACGA GTACCTCAGC 
CTCACCCGGC TGGGTCGGGC GACCCTGGAA CAGGGACGGC CCGACGTCGC CACCTTGCAC 
CTGGCCGCCG CGTTGGCCCT CTGGCGGGGC GCGGCCCTGG GATCGGGCAC CGAGTTCCTG 
GCCGAGACCG AGGTCGCGGC GTTGGAGGAG AGCCGGCTGA GCACCCAGGA ACTGTGGGTC 
GAGGCCGAAC TGTCGCTGGG CCGGTGCCGC GGCCTGATCG CCGAACTCAC CTCGCTGGTG 
GCCGCCCATC CCCTGCGGGA ACGCTTCCGG GCCCAGCTGA TGACCGCCCT GTGGCGCTCG 
CACCGGCGGG CCGACGCGCT GCGGACCTTC TTCGAGGGCC GGGAGCTGCT GGCCGACGAG 
CTCGGCGTCG ACCCGAGCCC ACTGCTCACC GAGCTGTACG AGGAGATCGT CGCCGAACCG 
GCGGACGGCC CGACGGTGCC TGGCGCGTCC GCCGACGGCC CGACCGGTCC CGTCGGCCCC 
CGAGCGCCGG CGCCGGCGCC GGCGCCGGCC ATGCTGCCGC CCGATCTGGC CGACTTCACC 
GGGCGGCGCA CCGAGGCGGC CCGGCTCAGC AGCTGGCTGG GATTCCAGCA CCCGGCGACC 
CCGCCCCGGC CGCACACCCC GGCCCCGTGC GCGGTGGCCT GCGACGGGCG CCCGCGGATG 
GCGCTGATCT CCGGTCCCCC GGGTGTCGGC CGGTCGTCGC TGGCCATCCA CGTCGCCCAG 
TTGGGCCGCC AGCTGTATCC CGACGGGCAG CTGTTCGTCG ATCTGGGCGG GCCCGGCCGG 
CCGCGGGTGG ACGTGCGCGA CGTGCTGGCC TGGTTCCTGC GGGCCCTGGG CGCCACCGCC 
GATCAGATTC CCGGCGACAC CCAGGAACGC GCGCAGGTGT ACCGGAGCAT GCTGGCGCGC 
CGGCGGGTGC TGGTGGTGCT GGACAACGCC GTCTCCGACG AACAGGTCCA CCTGCTCCTG 
CCGGCCGGCG CGGGCTGCGG AGTGCTGATC ACCAGCACCG AACCACTGGC CGCGGTACCG 
CTGAACCGGC AGATCGATCT CGGTCCGTTC GGCATGGACG AGGCGCTGGC GTTCCTGGGC 
CGCGCGGGCG GCCAGGACCG GGTACGAGTG GAGCGGCCGG CGGCGGTGGA GCTGGTCAAC 
AGCTGCGGCC GGTTCCCCCT GGCCCTGCGG ATCCTGAGCC TGCAGTTGAG CCGCAAGCCG 
CACTGGTCGC TGCGGCAGAT GGTCACGCAC CTGCACGCCG ACGCAACCCG GCTGGACCGG 
CTGCAGGCCG GGGCGCTGCA CATCCGACCG GCCCTGGACC GGTTGTTCGA CGCGATCGAG 
GAGGGCCGGC TCACCCAGAT CCGGCTGCTG GCCGACCTGC CAACCCCGAC CTTCACCGCG 
GACACGGTCG GCCGGTTCCT GGGGATGCCC GAGAGCCTGG CCGAGCACGT CTTGGAACAG 
CTGCTCGACC GGCGGCTGCT GGAGGTCATC GGGCTCGATG CCGGCCGCCG CCCGCTCTAC 
ACCTTCCCGC CGCTGACCCG GTTGGCCGCC CGCGAGCTGC GGCGCGGGGC CGGAACCCGG 
CCGGTGGTCG AGGGCGCCTG A

Protein sequence

MTGTRSELFA IIGNDLESGR SGSGLEPTRR DDSNPRSVLQ FRILGPVQVF CHGSEVQLGG 
SKQRTVLATL LLARGRVVTD AALSTVLWGE DPPRTSSAQI YTYVSRLRRS LGEQVELVRS 
GQGYALRAPH AWFDLDEYLS LTRLGRATLE QGRPDVATLH LAAALALWRG AALGSGTEFL 
AETEVAALEE SRLSTQELWV EAELSLGRCR GLIAELTSLV AAHPLRERFR AQLMTALWRS 
HRRADALRTF FEGRELLADE LGVDPSPLLT ELYEEIVAEP ADGPTVPGAS ADGPTGPVGP 
RAPAPAPAPA MLPPDLADFT GRRTEAARLS SWLGFQHPAT PPRPHTPAPC AVACDGRPRM 
ALISGPPGVG RSSLAIHVAQ LGRQLYPDGQ LFVDLGGPGR PRVDVRDVLA WFLRALGATA 
DQIPGDTQER AQVYRSMLAR RRVLVVLDNA VSDEQVHLLL PAGAGCGVLI TSTEPLAAVP 
LNRQIDLGPF GMDEALAFLG RAGGQDRVRV ERPAAVELVN SCGRFPLALR ILSLQLSRKP 
HWSLRQMVTH LHADATRLDR LQAGALHIRP ALDRLFDAIE EGRLTQIRLL ADLPTPTFTA 
DTVGRFLGMP ESLAEHVLEQ LLDRRLLEVI GLDAGRRPLY TFPPLTRLAA RELRRGAGTR 
PVVEGA