Gene Namu_1000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1000
Symbol
ID	8446592
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	1098798
End bp	1100312
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	71%
IMG OID	645040135
Product	transcriptional regulator, XRE family
Protein accession	YP_003200398
Protein GI	258651242
COG category	[R] General function prediction only
COG ID	[COG3800] Predicted transcriptional regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCGGACC GGCCGGCTGT CAAAAGTTCT GGTCCGCGAT CCGCGCAGGC TCGATCGGAG 
CCGATCAGAA CCGAACAGAA CGCCGGCGCC CCCGACCCGT TGACCATCGG CCGCCGGCTG 
CGGCACCTGC GCAAGGCCGC CGGCCTGACG CTGTCCGACG TCGCCGAGGC CGCCGGCATC 
AGCCCGTCGG CGCTCTCGTT GTTCGAGAAC GGCAAGCGGG AGGCCAAGCT GTCGCTGCTG 
ACCACCCTGG CCGGGGTGCT CGGCACCGAT CTGGGGGAAC TGCTGGCGGT GGCCCCGCCG 
AGCCGGCGGG CGGCGCTGGA GATCGAGCTG GAACGGGCGC AACGCTCGTC CGGGTTCAAG 
TCGCTGGAGA TCGCGGCGGT CAAGCCGGGC CCGCGGCTGC AGACCGAGGC GCTGGAGTCG 
CTGGTCGGCC TGCACCGGGC GCTGGCCCGG ATCCAGGCCG AGCGGCAGGC CACCCCGGAA 
CAGGCCCGCC GGGCCAACGC CGAGTTGCGC GCGGAGATGC GCCGGCGCGG CAACTACTTC 
GGCGAGATCG AGAAGGTGGC CGCCGATCTG CTGACCGCCA CCGGGTACGA GGGCGGTCCG 
ATCACCCGGT CCGTGGTCGA CCGGCTGGCC GCGCACCTGG GCTTCCGGCT GCGGCACTCG 
GGGGATCTGC CCCAGTCCAC CCGCACGGTG ACCGACCTGG CCCACCGCAT CATCTACCTG 
CCCCAGCCCG ACGCCGGCCA GCACGACTCG CGCTCCCTGG CCCTCAACGC GCTCGGCCAT 
GTGGTGCTGG GACACGAAGT GCCGCAGGAC TATTCGGAGT TCCTGCGGCA GCGGGTGGAG 
ATCAACTACT TCGCCGCCTC GCTGCTGATC CCCGAGCGCG GCGCGCTGAC CCTGCTCCGG 
CGGGCCAAGG CGGCCAAGGA CATCGCGATC GAGGACCTGC GCGATGCCTA CGCGGTCTCC 
TACGAGACCG CCGCGCACCG CTTCACCAAC CTGGCCACCC GGCACCTGGA CCTGCCCGTG 
CACTTCATGC GGATCAGCAA GGCCGGGGTG ATCTACAAGG CCTACGAGAA CGATGGCGTG 
CAGTTCCCGA TGGACGCGTC CGGGGCGATC GAGGGCCAGC GGGTCTGCCG GTACTGGACC 
GCCCGGGTCG TCTTCGACCG GCCCGACCTG TCCTCGGCCT ACCAGCAATA CACCGACACC 
AAGTCCGGAA CCTATTGGTG TACGGCCATT GTCGACCGCA CGGCGCAGGG CTTGTTCTCG 
GTCAACGTGG GTGTGCCCTA CGCCGACGTC AAGTGGATGC GCGGTCGGGA GACCACCGAA 
CGCTCCCGCT CCCGCTGCCC GGACCCGACC TGCTGCGCCC TGCCGCCGTC CGAGCTGGCC 
GACCGCTGGG AGGGCATGGC CTGGCCCAGC GCCCGGGTGC ACTCGCACCT GCTGGCCGCC 
ATGCCGCCCG GGGTCTTCCC GGGGGTGGAC CAGGTCGAGG TGCTCGGCTT CCTGGAGCGG 
CACTCCGCCG ACTGA

Protein sequence

MADRPAVKSS GPRSAQARSE PIRTEQNAGA PDPLTIGRRL RHLRKAAGLT LSDVAEAAGI 
SPSALSLFEN GKREAKLSLL TTLAGVLGTD LGELLAVAPP SRRAALEIEL ERAQRSSGFK 
SLEIAAVKPG PRLQTEALES LVGLHRALAR IQAERQATPE QARRANAELR AEMRRRGNYF 
GEIEKVAADL LTATGYEGGP ITRSVVDRLA AHLGFRLRHS GDLPQSTRTV TDLAHRIIYL 
PQPDAGQHDS RSLALNALGH VVLGHEVPQD YSEFLRQRVE INYFAASLLI PERGALTLLR 
RAKAAKDIAI EDLRDAYAVS YETAAHRFTN LATRHLDLPV HFMRISKAGV IYKAYENDGV 
QFPMDASGAI EGQRVCRYWT ARVVFDRPDL SSAYQQYTDT KSGTYWCTAI VDRTAQGLFS 
VNVGVPYADV KWMRGRETTE RSRSRCPDPT CCALPPSELA DRWEGMAWPS ARVHSHLLAA 
MPPGVFPGVD QVEVLGFLER HSAD