Gene Namu_2085 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_2085
Symbol
ID	8447695
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	2299975
End bp	2301069
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	70%
IMG OID	645041207
Product	transposase IS116/IS110/IS902 family protein
Protein accession	YP_003201452
Protein GI	258652296
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.000256
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0160957
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTACTG TGGCAGATTC GGTCGACGCC GTCATCGGCG GTGACACCCA TGTGGACACG 
ACGAGTTTGT CTGTGGTGTC CCCGGTCGGG GCGGTGATCG AGCAGATCAC GATCGACAAC 
GACGAGCAGG GTTACGCCCA GGTGGTGACC TGGATCCTGC GGGTGGTGCC TTCCGGCCGG 
TTCCTGGTCG GGTTGGAGGG CACCCGCAGC TACGGTGCGG GGCTGTGCCG GGCGTTGGAA 
GCGGTCGGGA TCCGGGTCGT CGAGGTCGAG CGGCCCTCCC GCGGGGAGCG GGGCCGGCGC 
GGCAAGTCCG ACCCGGGCGA TGCGGTGCTA GCCGCTCGTA AGGTGCTGGC CATGGCGGTG 
GAGCGGGTAC CGGCGCCGCG GACCGGCGAG GGAGTGCGGG AGGCGTTGCG GCTGCTGGTG 
GTGGACCGGG AACAGATGAC CCGGCACCGG ACCCAGCTGC ACAACCAGCT GCTGGCCGAG 
CTGCTCACCG GCACCGCCGA GCACCAGGCG CTGCGCCGAA AAGGTTTGAG TGGAACAGAT 
CTGGAGAAGC TGGCCAAGTC TCGTTGCCGG GGTGGGCGGC CGATCGAGGA GCAGGCCCGG 
CTGGTCGTGC TGCGCCGCAA GGCGAACGCG ATCATCCAGT TGGATCAGCA GATCCGGGAC 
AACGGCAAGA GCCTGACGAC GATCGTTCAG GACGCTGCTC CGCAGCTGCT CAAGCAGGTC 
GGCGTCGGCC CGGTCGTCGC CGCCCAGCTG ATCGTGTCCT ACAGCCACCA CGGCCGCTGC 
CGGGACGAGG CGGCGTTCGC GGCGCTGGCC GGGGCCAGCC CGGTCCCGGC GTCCAGCGGC 
CGGATCGTGC GGCACCGGCT CAACCGGGGC GGCGACCGCC AACTGAACCG GGCCCTGCAC 
ACCGTCGCGG TCACCCGGGC CCAGTGGGAC GAGCGAACCC AGGACTACAT CCGCCGGCGC 
AGCGGCAGCC TGACGGCCAA AGAGATCCGC CGGATGCTCA AGCGGTACAT CGCCCGCGAG 
ATGTTCAAGA TCCTGCGCAC CATCGAGGCG TTGAACCCGA CGATGACCAA CGGTCAGGCC 
GCCACGGCCG CCTGA

Protein sequence

MPTVADSVDA VIGGDTHVDT TSLSVVSPVG AVIEQITIDN DEQGYAQVVT WILRVVPSGR 
FLVGLEGTRS YGAGLCRALE AVGIRVVEVE RPSRGERGRR GKSDPGDAVL AARKVLAMAV 
ERVPAPRTGE GVREALRLLV VDREQMTRHR TQLHNQLLAE LLTGTAEHQA LRRKGLSGTD 
LEKLAKSRCR GGRPIEEQAR LVVLRRKANA IIQLDQQIRD NGKSLTTIVQ DAAPQLLKQV 
GVGPVVAAQL IVSYSHHGRC RDEAAFAALA GASPVPASSG RIVRHRLNRG GDRQLNRALH 
TVAVTRAQWD ERTQDYIRRR SGSLTAKEIR RMLKRYIARE MFKILRTIEA LNPTMTNGQA 
ATAA