Gene Namu_2044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_2044
Symbol
ID	8447653
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	2255105
End bp	2256484
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	68%
IMG OID	645041169
Product	transposase mutator type
Protein accession	YP_003201415
Protein GI	258652259
COG category	[L] Replication, recombination and repair
COG ID	[COG3328] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0327519
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.00538259
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCATGA CCGAGCATTC CTCGTCGTTG CCGGCGGATG ATGCGGTGCC GGGGCCGGGG 
CGGGTGAGTG GCCGGCAGCT GCGGGAGTTG CTGGCCGACG ACGTGTGGCT CGACGAGTTG 
ATCGACCGCG CCGAGGCCGG CGGTGTCCGG CTGACCGGCG AGGGCGGGTT CCTGCCGGAG 
ATGATCAAGG CGGTGCTCGA GCGGGGCCTG GCTGCGGAAC TGACCTCGCA TCTGGGATAC 
GAGGTGGGCG ACCCGGCTGG TCGGGGCTCG CCGAACAGCC GGAACGGGCA CACCCCGAAA 
ACGGTGGCGA CCGAGGTCGG GCCGGTCCCG TTGAGCGTGC CGCGGGACCG GACGTCGACG 
TTCGAGCCGC GTCTGGTGCC CAAGGGTCAA CGCCGCCTGG GCGGGTTGGA CGAGCAGATC 
ATCAGCTTGT ACGCGGGCGG CATGACCGTC CGCGATATCC AGGCTCATCT GGCCCGCACG 
TTGGGCACCG AGCTGTCCCA CGACACGATC AGCAAGATCA CCGACGCGGT GCTGGACGAG 
GTCAAGGCCT GGCAGTCCCG GCCGTTGGAA GAGCTCTACC CGATCATGTA CCTGGACGCG 
ATCGTGGTGA AGGTCCGCGA CGGGCACCAG GTTCGGAACA AGAGCGCGTA CATCGCCGTC 
GGCGTCGATA TGGCCGGGAT CAAGCACGTG CTGGGGATCT GGGTGCAGTC CACCGAGGGC 
GCCAAGTTCT GGGCCGGGGT CTGCGCCGAG CTGGCCAACC GGGGCGTCAA GGACGTGCTG 
ATCGTGTGTT GCGACGGGCT GACCGGGCTA CCCGAGGCGA TCGAGGCGAC CTGGCCGCGG 
ACGACCGTCC AAACGTGTGT GGTCCACCTG ATCCGGGCCT CGATGCGGTT CGTGTCCTAC 
ACCGACCGGC GGGCTGTCGT GGCCCAGCTC AAGACGATCT ACACCGCCCC GACCGTGGAC 
GCCGCCGAGA CGGCGCTGTT GACGTTCGCC GAGACCGATC TGGCCCGCCG CTACCCGGCC 
TGCCTGCGGA CCTGGCAGGA CGCCTGGGAC CGGTTCATCC CGTTCCTGGC GTTCCCATGG 
CCGGTCCGCA AGATCATCTA CACCACGAAC GCGATCGAGT CGTTGAACTA CCAGCTCCGC 
AAGATCATCA AGAACCGCGG GCACTTCCCC AACGACGACG CAGTGGTCAA GCTGCTGTGG 
CTGGCCATCC GCGATATCGA GGACAAACGC GCCCGGGACC GGACCTCGGA GAAGGGCAAA 
CGAGTCGGAC GCACCGCCGA GGGCCGGCTC GTCGAGGGCC AGGTCACCAC CGGTTGGAAA 
CCCGCGCTCG GTGCACTGGC CATCCAATAC CCCGACCGCA TCACCCCCAG GATCAGCTGA

Protein sequence

MTMTEHSSSL PADDAVPGPG RVSGRQLREL LADDVWLDEL IDRAEAGGVR LTGEGGFLPE 
MIKAVLERGL AAELTSHLGY EVGDPAGRGS PNSRNGHTPK TVATEVGPVP LSVPRDRTST 
FEPRLVPKGQ RRLGGLDEQI ISLYAGGMTV RDIQAHLART LGTELSHDTI SKITDAVLDE 
VKAWQSRPLE ELYPIMYLDA IVVKVRDGHQ VRNKSAYIAV GVDMAGIKHV LGIWVQSTEG 
AKFWAGVCAE LANRGVKDVL IVCCDGLTGL PEAIEATWPR TTVQTCVVHL IRASMRFVSY 
TDRRAVVAQL KTIYTAPTVD AAETALLTFA ETDLARRYPA CLRTWQDAWD RFIPFLAFPW 
PVRKIIYTTN AIESLNYQLR KIIKNRGHFP NDDAVVKLLW LAIRDIEDKR ARDRTSEKGK 
RVGRTAEGRL VEGQVTTGWK PALGALAIQY PDRITPRIS