Gene Namu_2050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_2050
Symbol
ID	8447659
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	2259834
End bp	2261213
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	68%
IMG OID	645041173
Product	transposase mutator type
Protein accession	YP_003201419
Protein GI	258652263
COG category	[L] Replication, recombination and repair
COG ID	[COG3328] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0245972
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.002439
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGACCATGA CCGAGCATTC CTCGTCGTTG CCGGCGGATG ATGCGGTGCC GGGGCCGGGG 
CGGGTGAGTG GCCGGCAGCT GCGGGAGTTG CTGGCCGACG ACGTGTGGCT CGACGAGTTG 
ATCGACCGCG CCGAGGCCGG CGGTGTCCGG CTGACCGGCG AGGGCGGGTT CCTGCCGGAG 
ATGATCAAGG CGGTGCTCGA GCGGGGCCTG GCTGCGGAAC TGACCTCGCA TCTGGGATAC 
GAGGTGGGCG ACCCGGCTGG TCGGGGCTCG CCGAACAGCC GGAACGGGCA CACCCCGAAA 
ACGGTGGCGA CCGAGGTCGG GCCGGTCCCG TTGAGCGTGC CGCGGGACCG GACGTCGACG 
TTCGAGCCGC GGCTGGTGCC CAAGGGCCAA CGCCGCCTGG GCGGGTTGGA CGAGCAGATC 
ATCAGCTTGT ACGCCGGCGG CATGACCGTC CGCGATATCC AGGCCCATCT GGCCCGGACA 
CTGGGCACCG AGCTGTCCCA CGACACGATC AGCAAGATCA CCGACGCGGT CCTGGAAGAG 
GTCAAGGCCT GGCAGTCCCG GCCGTTGGAA GAGCTCTACC CGATCATGTA CCTGGACGCG 
ATCGTGGTGA AGGTCCGCGA CGGGCACCAG GTTCGGAACA AGAGCGCGTA CATCGCAGTC 
GGCGTCGATA TGGCCGGGAT CAAGCACGTG CTGGGGATCT GGGTGCAGTC CACCGAGGGC 
GCCAAGTTCT GGGCCGGGGT CTGCGCCGAG CTGGCCAACC GGGGCGTCAA GGACGTGCTG 
ATCGTGTGTT GCGACGGGCT GACCGGGCTA CCCGAGGCGA TCGAGGCGAC CTGGCCGCGG 
ACGACCGTCC AAACGTGTGT GGTCCACCTG ATCCGGGCCT CGATGCGGTT CGTGTCCTAC 
ACCGACCGGC GGGCTGTCGT GGCCCAGCTC AAGACGATCT ACACCGCCCC GACCGTGGAC 
GCCGCCGAGA CGGCGCTGTT GACGTTCGCC GAGACCGATC TGGCCCGCCG CTACCCGGCC 
TGCCTGCGGA CCTGGCAGGA CGCCTGGGAC CGGTTCATCC CGTTCCTGGC GTTCCCATGG 
CCGGTCCGCA AGATCATCTA CACCACGAAC GCGATCGAGT CGTTGAACTA CCAGCTCCGC 
AAGATCATCA AGAACCGCGG GCACTTCCCC AACGACGACG CAGTGGTCAA GCTGCTGTGG 
CTGGCCATCC GCGATATCGA GGACAAACGC GCCCGGGACC GGACCGCGGA GAAGGGCAAA 
CGAGTCGGAC GCACCGCCGA GGGCCGGCTC GTCGAGGGCC AGGTCACCAC CGGTTGGAAA 
CCCGCGCTCG GTGCACTGGC CATCCAATAC CCCGACCGCA TCACCCCCAG GATCAGCTGA

Protein sequence

MTMTEHSSSL PADDAVPGPG RVSGRQLREL LADDVWLDEL IDRAEAGGVR LTGEGGFLPE 
MIKAVLERGL AAELTSHLGY EVGDPAGRGS PNSRNGHTPK TVATEVGPVP LSVPRDRTST 
FEPRLVPKGQ RRLGGLDEQI ISLYAGGMTV RDIQAHLART LGTELSHDTI SKITDAVLEE 
VKAWQSRPLE ELYPIMYLDA IVVKVRDGHQ VRNKSAYIAV GVDMAGIKHV LGIWVQSTEG 
AKFWAGVCAE LANRGVKDVL IVCCDGLTGL PEAIEATWPR TTVQTCVVHL IRASMRFVSY 
TDRRAVVAQL KTIYTAPTVD AAETALLTFA ETDLARRYPA CLRTWQDAWD RFIPFLAFPW 
PVRKIIYTTN AIESLNYQLR KIIKNRGHFP NDDAVVKLLW LAIRDIEDKR ARDRTAEKGK 
RVGRTAEGRL VEGQVTTGWK PALGALAIQY PDRITPRIS