Gene Namu_2193 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_2193
Symbol
ID	8447804
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	2421407
End bp	2422564
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	73%
IMG OID	645041315
Product	transcriptional regulator, SARP family
Protein accession	YP_003201559
Protein GI	258652403
COG category	[T] Signal transduction mechanisms
COG ID	[COG3629] DNA-binding transcriptional activator of the SARP family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.00163999
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00133858
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGACGCCCC CGCACCCCGG CCCGCCCGAG GCCGGTGGCG TGTCCCCGAC GCTGGACGTG 
CGACTGCTCG GACCGCTGGA GCTGCGCCTG GACGGCCGGC CGATCCCGTT GCCGGGCGGC 
AAACCCAAGG CCGTGCTGGC CGGGTTGCTG GTCAGCCGCA ATCGCGTGGT GCCGGCCGAC 
TCTTTGGCCG ACGCGATCTG GGACGGTGAG GTGCCGGCCA ACTTCCTGGC CACCCTGCAG 
GTCCACGTGT CCGCCCTGCG CCGGGCGCTG CGCCCGGTGT CCGACCCGGG GCTGCTGACC 
GTCACCACCC AGTCGCCCGG CTACCGCGTC GTCGTCGACG ACGCACTGGT CGACGTCGGC 
CGGTTCGGCC GGTGGGCGCG GGCCGGCAGC GACCTGCTGA CCGCCCGCCG CTACGCCGAG 
GCGGCCGACC GGCTACGGGC CGCCCTGGCC GAGTGGTCCG GGTCCGCGCT GGCCGACCTG 
CAGGGCCTGC GGTTCGCCGA CGACTTCGCC GCCGCCGTGG AGGAGGAGCG GCTGGTCGCG 
TTGCAGGCCC GGATCGAGGC CGACCTGGCC TGCGGGATGG AGTCGGCGGT GGTCGGCGAA 
CTGGTCACCC TCACCGGCCA GTACCCGTTG CGCGAGCCGT TCTGGATCCA GCTGATCACT 
GCCCTGTATC GCTCGGGCCG GCAGGCGGAC GCGCTGGACG CGGCCCGCCG CATCCGGACC 
CTGCTCGACG ACGAACTCGG CATCGATCCC AGCCCGGCGC TGCGGGACCT GGAACGGCAG 
GTGCTGCGCC AGGAACTGGC AGCGCCCGGA CCGGCCCCCG TGCCGTCGAT GCAGCGCACC 
GTGGCCGAGA CCGCGGTTGT GCTGTCCAAG GCCCGGGTGC GACTGCCGTC CGGGGAATCG 
TTGCCGGTGC CCAGCCGGGG TCTGCGCCTG GGCCGGATGG ACGACAACGA CCTGGTGATC 
GCCGGGGAGA AGGTCAGTCG CTACCACGCG GTGATCGGCG AATCCGCGAA CGGCTTCACG 
GTGACCGACC TGCGCTCCAC CAACGGCACC CACGTCAACG ACGAGCGGGT GGTGGAGAGC 
CATCTGCTGC GCGACGGGGA TCGGATCCGC ATCGGCGGCA CCGAATTGAC CTTCCAGCTC 
GACGCCGAGC CCGCCTGA

Protein sequence

MTPPHPGPPE AGGVSPTLDV RLLGPLELRL DGRPIPLPGG KPKAVLAGLL VSRNRVVPAD 
SLADAIWDGE VPANFLATLQ VHVSALRRAL RPVSDPGLLT VTTQSPGYRV VVDDALVDVG 
RFGRWARAGS DLLTARRYAE AADRLRAALA EWSGSALADL QGLRFADDFA AAVEEERLVA 
LQARIEADLA CGMESAVVGE LVTLTGQYPL REPFWIQLIT ALYRSGRQAD ALDAARRIRT 
LLDDELGIDP SPALRDLERQ VLRQELAAPG PAPVPSMQRT VAETAVVLSK ARVRLPSGES 
LPVPSRGLRL GRMDDNDLVI AGEKVSRYHA VIGESANGFT VTDLRSTNGT HVNDERVVES 
HLLRDGDRIR IGGTELTFQL DAEPA