Gene Namu_5286 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_5286
Symbol
ID	8450919
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5903354
End bp	5904592
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	70%
IMG OID	645044319
Product	transposase IS111A/IS1328/IS1533
Protein accession	YP_003204541
Protein GI	258655385
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	57
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTCCCTGC CCGAATGCGA TTTCTACGTC GGTATCGATT GGGCCGCCCA AACGCACGCC 
GTGTGTGTGC AGGACGCGGC CGGGAAGATC ACCGCGCAGT TCACGATCGA GCACACCGCC 
GACGGATTCG CGACCCTGTT GGCCCGTCTG GGTCGGTTGG CCAGCGACCC GATGCAGGTC 
AGCGTCGCCC TGGAACGGCC CGACGGTCGG CTGGTCGACG CCCTGCTCGA AGCGGGCTAC 
CCGGTGGTGC CGGTCAGCCC GAACGCGATC AAGACCTGGC GCGACGGGGA GGTACTGTCC 
GGCGCCAAGT CCGACGCCGG CGACGCCGCC GTCATCGCCG AATATCTGCG GCTGCGGTCG 
CACCGGCTGC GGCCGGCCAC CCCGTTCACC CCGGCGACCA GGGCGCTGCG TACGGTCGTA 
CGCACCCGCG ATGACATCGT GGCCATGCGG ACCGCCACGG CGAACCAGCT GACCGCCCTG 
CTCGATGCCC ACTGGCCCGG CGCCACCAAG GTTTTCGCCG ATATCGAGTC GCCGATCGCG 
TTGGAGTTCC TGACCCGGTA CCCGACCGCC AAACACGCCG CGGGCCTGGG TGAGAAGCGC 
ATGGCCGCGT TCTGCGTCAA GCACGGCTAC TCCGGTCGCC GCTCGGCCGC GGAGCTGCTG 
ACCCGATTGC GGGCTGCGCC GGCCGGCACC ACCGACCCGG ACCTGGTCGA GGCCGTCCGG 
GACGCCGTGC TGGCGCTGGT GGCCGTGCTG CGCACCCTGG GCGAGACCCG CAAGGACCTG 
GACCGGTCGG TGACCGCCCA CCTCGGGGAG CACCCGGACG CCGCGATCTT CACGTCGCTG 
CCAAGGTCGG GTCAGATCAA CGCCGCCCAG GTGCTCGCCG AGTGGGGCGA TTCCCGGCAA 
GCCTACGACT CGCCCGACGC CGTCGCGGCG TTGGCCGGCC TGACCCCGGT CACCAAAGCG 
TCCGGTAAAT ATCATGCCGT GCATTTCCGG TGGGCCTGCA ACAAACGATT CCGTAAAGCG 
ATGACCACGT TCGCCGACAA CAGTCGCCAC CAAAGCCCGT GGGCCGCCGA GGTCTACCGC 
AGAGCTATCC AACGCGGGCA CGACCACCCG CACGCCGTCC GGGTCCTGGC CCGCGCCTGG 
GTGCGCGTGA TCTACCGCTG CTGGCTCGAC CGAGAGCCTT ACGACCCGGC CAGGCACGGC 
AACGCGAACA AGATCAACAG CGGGCAACTT GCGGCCTGA

Protein sequence

MSLPECDFYV GIDWAAQTHA VCVQDAAGKI TAQFTIEHTA DGFATLLARL GRLASDPMQV 
SVALERPDGR LVDALLEAGY PVVPVSPNAI KTWRDGEVLS GAKSDAGDAA VIAEYLRLRS 
HRLRPATPFT PATRALRTVV RTRDDIVAMR TATANQLTAL LDAHWPGATK VFADIESPIA 
LEFLTRYPTA KHAAGLGEKR MAAFCVKHGY SGRRSAAELL TRLRAAPAGT TDPDLVEAVR 
DAVLALVAVL RTLGETRKDL DRSVTAHLGE HPDAAIFTSL PRSGQINAAQ VLAEWGDSRQ 
AYDSPDAVAA LAGLTPVTKA SGKYHAVHFR WACNKRFRKA MTTFADNSRH QSPWAAEVYR 
RAIQRGHDHP HAVRVLARAW VRVIYRCWLD REPYDPARHG NANKINSGQL AA