Gene Namu_4069 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4069
Symbol
ID	8449689
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	4484016
End bp	4485344
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	69%
IMG OID	645043113
Product	transposase IS204/IS1001/IS1096/IS1165 family protein
Protein accession	YP_003203348
Protein GI	258654192
COG category	[L] Replication, recombination and repair
COG ID	[COG3464] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.414136
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCAGA GTAGTAGCTC GCTGCTGTTG GACATTGACG GGTTGGTCGT CGACCGGGTC 
GTCCGCAACG ACGCCGGCCG ACGGGTCGTG CACTGCTCGA CCGACCCCCA ACTGGCCGGC 
TGGTGCCCGG AGTGCGGTGA GCAGTCGAAG TCTCCGAAGG CGTGGGTGAC GACCCGCCCG 
CGGGACGTCC GGCTCGGCGA GGACAAGCCG ATCCTGTTGT GGCGCAAACG GAAATGGCGC 
TGCCAGGTCG ACAGCTGCGA GCGGAAGGTG TTCACCGAAT GCCTACCCGA GCAGATCCCT 
GCCCGGGCCC GGATCACCAC CCGCGCCCGC CGGCTGGCGG CGGAAGCGAT CGGCGACCAC 
ACCCGACCGG TGTCCGGCGT CGCGGCCGAG TTCGGCATGG ACTGGCGCAT CGCGCACGAC 
GCGTTCGTCG CCCACTCTGC CGCGGTGCTC CCCGACGCGC CGCCGCCGGT CACCGTGCTG 
GGCGTCGACG AGACCCGCCG CGGCAAGGCC CACTACGAGA CCGACCCGAC CACCGGGGAG 
AAGACCTGGG TGGACCGGTT CGACACCGGC CTGGTCGATC TGAGCGGCAA CGGTGGCCTG 
TTCGCACAGG TCAACGGCCG CACCAGCAAG GTCCTCATCG AGTGGCTGCA GGCGCAGGAC 
CCGGACTGGC TCGCCACCAT CACCCACATC TCGATGGACA CGTCCGCGAC GTACGCCCGC 
GCCGCCCGCC TCGCCCTGCC GAACGCCGTC GTGGTCGTGG ACCGGTTCCA CCTGGTCGCC 
CTGGCCAACA AGGCGGTCAC CGACTACCGG CGGGAGTTGG CCTGGGCGCT TCGTGGCCGG 
CGGGGCCGCA AGTGCGACCC GGAATGGGCG CAACGGAACC GGCTGCTGCG CGCCGTGGAG 
ACTCTCACTC CGGACGAGCT GGCCAAGGTG CGGGAAGCGA TGCGCCGGGC CGACCCCTCC 
GGCGGCCTCG AGAAATGCTG GCAGGGCAAG GAACTGCTCC GCAAGCTGCT CAAGCTCGCC 
GGCACCAACC CCGACCGCGG ACAGATCTTC AACGCGCTGA CCGCGTTCTA CCTGCACTGC 
GCCGACTCCG AGATCTCCCA GCTGCGCAGG CTCGCGTGGA CGGTGCATGC CTGGCAGAAC 
TCGATCATCG CCGGCCTGCA CACCGGCATC AGCAACGGCC GCACCGAGGG CTACAACCGG 
ATCGTCAAAC ACATCGGCCG GATCGCGTTC GGCTTCCGCA ACCAGGACAA CCAGAAGCGG 
CGGATACGCT ACGCCTGCAC CCGGAAATCC CGGGCGTCAA CCAGCAGCGC GAAGCCCTGC 
CAACTCTGA

Protein sequence

MDQSSSSLLL DIDGLVVDRV VRNDAGRRVV HCSTDPQLAG WCPECGEQSK SPKAWVTTRP 
RDVRLGEDKP ILLWRKRKWR CQVDSCERKV FTECLPEQIP ARARITTRAR RLAAEAIGDH 
TRPVSGVAAE FGMDWRIAHD AFVAHSAAVL PDAPPPVTVL GVDETRRGKA HYETDPTTGE 
KTWVDRFDTG LVDLSGNGGL FAQVNGRTSK VLIEWLQAQD PDWLATITHI SMDTSATYAR 
AARLALPNAV VVVDRFHLVA LANKAVTDYR RELAWALRGR RGRKCDPEWA QRNRLLRAVE 
TLTPDELAKV REAMRRADPS GGLEKCWQGK ELLRKLLKLA GTNPDRGQIF NALTAFYLHC 
ADSEISQLRR LAWTVHAWQN SIIAGLHTGI SNGRTEGYNR IVKHIGRIAF GFRNQDNQKR 
RIRYACTRKS RASTSSAKPC QL