Gene Namu_4520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4520
Symbol
ID	8450147
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5022745
End bp	5024226
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	70%
IMG OID	645043560
Product	Integrase catalytic region
Protein accession	YP_003203788
Protein GI	258654632
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGTGG ACACGGTCAA GCAGCGGGAA CGGGCGCAGC AGATCGCGTT GTTCCGATAT 
CAGTTGATCT GCCCGGCGCT GGAACCGGGC CTGTCGACCA AGCAACGCGG ACGGGTCGTT 
CGGGCGATCG CCGACCGGGA ACACGACGGC CCGTTCGGCG GCCGGGTCCG ATACTCGCGG 
GAGTCGTTGG ACCGGTGGAT CCGCCGGTAC CGGGCCGGCG GGTTCGAAGG TCTGTGCCCG 
TCGCCCCGGG AACCCGGCAC CCGGATCGAC ACCGGCGTGT TCGAGCTGGC CGCCGGTCTG 
AAACGGGAGA ACCCGGCCCG CACGGTCGCC CAGGTCGCCC GGATCCTGCG ATCCTCGACC 
GGCTGGTCAC CGTCGGAAAC GACGCTGCTG CGGCATTTCC ACCGGCTGGA CCTGATGGTG 
CCCGGCGGCG CCGGGCCGGC CGTGTTCGGC CGGTTCGAAG CGGCCGATTG CAACGAACGG 
TGGGTCGGCG ACGCCCTGCA CGGGCCCAGG GTCGCCGGCC GGAAAACGTA CTTGTTCGCG 
TTCCTGGACG ACCACAGCCG GGTGGCCGTG GGGTATCGGT TCGGGTTCGC CGAGGACACC 
GTCCGGCTGG CCGCGGCCCT GCAACCCGCG TTGGGCAGCC GCGGCGTCCC CGGCTCGGTC 
TACGTCGACA ACGGGTCCGC GTTCGTCGAC AACTGGCTGC TGCGGGCCTG CGCGGTGCTC 
GGGATCCGGC TCGTCCACAG CCGTCCGGGG CAGCCGCAGG GGCGGGGCAA GATCGAACGC 
TGGTTCCGCA GCGTGCGCGA CCAGTTCCTG GTCGAGATCG ATGACAGCAC CGCCGACCAG 
ATCCGGGATA CCGGGATGAC CCCCGCCGGC GCCCTGCTGG AACTCAACGG GTTGTTCACC 
GCCTGGGTCG AGGCGTCCTA TCACCACCAC GTGCATTCCG AGACCGGGCA GAGCCCCTTG 
CAACGCTGGA CCGACGGGTG GCAGCGGGCC GGCCGGTCTC CGGCGATGCC GACCCCCGCG 
GATCTGACCG AGGCGTTCCT GTGGTCCGAA CAACGCGTGG TCACCAGGAC CGCGACGGTG 
TCGCTGCACG GCAACACCTA CCAGGTTCAG GCGGGGCTGG TCGGTCGGAA AGTCGAGTTG 
GTGTTCTCCC CGTTCGATCT GGAAACCCTG CGGGTCCGCT ACGACGGCCG GGACCACGGG 
CCGGCGGTGC CGCATCGGAT CACCCGGCAC ACCCATCCCA AGGCCAGACC CGAGACCCCT 
GAACCGGCAA CGACACCGCG GACGGGGATC GACTACCTGG CGCTGGTCGC GCAGGACCAC 
CAGCAACAGA TCAGTGCCGA CCAGAAGATC AACTATCACG CCCTCTACCC AGGTGAGCTG 
CCCGGGCAGC GCAGCATCGA CGACGCCCTG GCCGACCTCA ACGGCAACGA CGGCAACGAC 
GGCAACGACG GCAACGACGA TGGTCAGGCG GTGGCCCGGT GA

Protein sequence

MSVDTVKQRE RAQQIALFRY QLICPALEPG LSTKQRGRVV RAIADREHDG PFGGRVRYSR 
ESLDRWIRRY RAGGFEGLCP SPREPGTRID TGVFELAAGL KRENPARTVA QVARILRSST 
GWSPSETTLL RHFHRLDLMV PGGAGPAVFG RFEAADCNER WVGDALHGPR VAGRKTYLFA 
FLDDHSRVAV GYRFGFAEDT VRLAAALQPA LGSRGVPGSV YVDNGSAFVD NWLLRACAVL 
GIRLVHSRPG QPQGRGKIER WFRSVRDQFL VEIDDSTADQ IRDTGMTPAG ALLELNGLFT 
AWVEASYHHH VHSETGQSPL QRWTDGWQRA GRSPAMPTPA DLTEAFLWSE QRVVTRTATV 
SLHGNTYQVQ AGLVGRKVEL VFSPFDLETL RVRYDGRDHG PAVPHRITRH THPKARPETP 
EPATTPRTGI DYLALVAQDH QQQISADQKI NYHALYPGEL PGQRSIDDAL ADLNGNDGND 
GNDGNDDGQA VAR