Gene Namu_1960 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1960
Symbol
ID	8447569
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	2159792
End bp	2161027
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	68%
IMG OID	645041092
Product	transposase IS116/IS110/IS902 family protein
Protein accession	YP_003201338
Protein GI	258652182
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.261169
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0163724
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGTGA TGTTCGAGCG GGTCGCTGGG ATCGACATCG GCAAGGCGAC GCTGACGGTG 
TGCGTGCGCA CGCCCGGGGA TCGGGGCCGC CGGCGCCGGA GCGAGACCCG CACGTTCAAG 
ACGACGACCG GGTCGCTGCT GGTGATGCGG GACTGGCTGT TGGAGTGCGG GGTGACGATC 
GCGGCGCTGG AGTCGACCTC GACGTACTGG AAAGGCACGT TCTACTGCCT GGAGGACCAC 
ATGCAGGTGT GGCTGCTCAA CGCCGCTCAC ATGCATGCTG TGCCCGGCCG GAAGACGGAC 
GTGAAAGACG CCGAGTGGAT TGCTCAGCTG CTCGAGCACG GGCTGCTGAA CCCGTCGTTC 
GTGCCGCCGC CTGACATCCG CCAGTTGCGG ATGCTGACCC GGCACCGGGT CCAGCTGATG 
GGTGACCGGA CGCGGGAGAC CGTGCGGCTG GAACTGATGT TGGAGGACGC GTCGATCAAG 
CTGTCGACCG TCGCTTCGAG CCTGACGACG GTGTCGGCGC GGCGGATGCT GGCGGCGATG 
ATCAACGGCC AGACCGACCC GGTCAAGATC GCGGATCTGG CTCTGGGGAA GATGCGAGTC 
AAGATCCCCG ACCTGGCCCA GGCGCTGACC GGGAATTTCA CCGAGCACCA CGCGACGATG 
GCCAAGGCGA TCCTGCGGCG GCTGGACCTG GTCGAGCAGG CCATCAAGGA GAGCGACGAG 
GTGATCGCCG CAGCATGTGC GCCCTGGCAG CACGAGATCG AACTGCTGCA GACGATCCCC 
GGGGTCGGGG AGAAGGTCGC CCAGGTGATC GTCGCGGAGA CCGGGGCGGA CATGTCCCGG 
TTCCCATCCG CGGGCCATCT GGCCGCCTGG GCCGGTGTCG CGCCGGCCGT CAACGAGTCC 
GCCGGCCGCA GTTGGACCGC CGGGACCCGA CACGGCAACA AGTGGCTGTG CGCGATCCTG 
ATCGAGGCGG CCGGGTCGGT CAGCCGGATG CACGGCCGCA ACTACCTGGC CGAGCAGCAC 
CAGCGCCTCG CCTCCCGTAG GGGTGTCAAA CGGGCGCAGG TCGCGGTGGC GCACTCGATC 
CTGGTCGCGG CCTACTACAT GCTCAGCCGC GATGAGCCGT ACCGGGACCT GGGCGCGGAC 
TGGTACTTGC GCCGTAACAA CGAGGCGCAC ACGCGCCGGT TCGTGCGGCA GCTGGAGAAG 
CTCGGCCACA CGGTCCACCT CGATCCCACC GCCTGA

Protein sequence

MEVMFERVAG IDIGKATLTV CVRTPGDRGR RRRSETRTFK TTTGSLLVMR DWLLECGVTI 
AALESTSTYW KGTFYCLEDH MQVWLLNAAH MHAVPGRKTD VKDAEWIAQL LEHGLLNPSF 
VPPPDIRQLR MLTRHRVQLM GDRTRETVRL ELMLEDASIK LSTVASSLTT VSARRMLAAM 
INGQTDPVKI ADLALGKMRV KIPDLAQALT GNFTEHHATM AKAILRRLDL VEQAIKESDE 
VIAAACAPWQ HEIELLQTIP GVGEKVAQVI VAETGADMSR FPSAGHLAAW AGVAPAVNES 
AGRSWTAGTR HGNKWLCAIL IEAAGSVSRM HGRNYLAEQH QRLASRRGVK RAQVAVAHSI 
LVAAYYMLSR DEPYRDLGAD WYLRRNNEAH TRRFVRQLEK LGHTVHLDPT A