Gene Namu_3698 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3698
Symbol
ID	8449317
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	4059933
End bp	4061114
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	71%
IMG OID	645042759
Product	integrase family protein
Protein accession	YP_003202995
Protein GI	258653839
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.0843425
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.150744
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCAGA GCGTGATGGC CCGACCCGAC GGCGGGCCTC GCACGTGGAC GGTGATCGAT 
CAGGGATACC GGACGGTCGG ACCGGTCGAG GAGTGGCTGG AGGCCCACCG GCATCTTTGG 
TCGCCGAACA CGGTCCGCGG GTACGCGACC GCGCTGAGCC AGTGGTGGAC GTTCCTTGAA 
CAGCGGGCCG AGTCCGGGCG GTGGAACGAG ATCGGCGTGC CGACGGTGTC GGCGTTCGTG 
TCCTGGATGC GCAACGGGCG CCGGGTCGAG CGTTCCCTGG TGCCGGAGGA CGGGCCGTCG 
CCGGAGACGA TGCAGGCGCG GCTGGCCGCG GTCATCTCCT TCTACACGTG GCACGAAGCC 
GTGTCCGGCG TTCCGGTGGC CGGCCGGTTG ATGCGTGGAG CGCCGCGGCG GGCAGTGGCC 
CGGGGGCTGC TGTCCCATCT GGATGCCCGC TCGGGGCCCG CTCCGACGTC GCTGGTCCGG 
GTGCGCCGCA GCCGGCGGCA TCGTCCGCCG TTGCTGATGC CCCAGCAGAT CCAGGCGATC 
CTGGATGGCT GCGCCACCTA CGATCCAGAC ACCGGTGAAT GGGTCGGAAA CCTGCGTGAC 
CGGCTGCTTT TCGCCGTTCT TGCGGAGAGC GGCATGCGGA TCGGCGAGGC GTTGGGTTTG 
CGGATCAGCG ACTTCGTGAT GGGTCGCGGC GGCACCCCGT TCATCGAGAT CGTGCCTCGC 
GCGGACAACA CCAATGGGGC GCGGGTGAAG ATGATGCGTC CCCGCCGGGT CTACGTCGGC 
GCCGATCTCG AGCGGCTGTT CGCCGACTAC CTGACCCTCC TGGCCTGCAC AGCAGCCGAT 
ATGGGCATCG CGGTGGCGGC GGACTCGCCG CTGCTGGTCA ACCTGCAACG GCCGCCGCTG 
CTGGCTGCGC TGCACGAGGG CACCGTCCGC GACAAGACGG CCGCGCTGCG GAAGAAGGGG 
ATCGGCCCGC CCGGGTGGAC CCCGCACTGG TTCAGGCATA GCCACGCGAC CGCGTTGCTG 
CTGGCCGGCA CGGCGGAGTG GGTGGTGTCC CGTCGGCTGG GGCACGCCCA CGTCCAGACC 
ACGCTGGACC TCTACGGCTG GGTCCGCGAG GACGAGGCGC TGCGGGCGGC GGCGAACTGG 
ACGTCGTACG CGTCCAATTG GCGGGTGACC GATGCGCCGT GA

Protein sequence

MAQSVMARPD GGPRTWTVID QGYRTVGPVE EWLEAHRHLW SPNTVRGYAT ALSQWWTFLE 
QRAESGRWNE IGVPTVSAFV SWMRNGRRVE RSLVPEDGPS PETMQARLAA VISFYTWHEA 
VSGVPVAGRL MRGAPRRAVA RGLLSHLDAR SGPAPTSLVR VRRSRRHRPP LLMPQQIQAI 
LDGCATYDPD TGEWVGNLRD RLLFAVLAES GMRIGEALGL RISDFVMGRG GTPFIEIVPR 
ADNTNGARVK MMRPRRVYVG ADLERLFADY LTLLACTAAD MGIAVAADSP LLVNLQRPPL 
LAALHEGTVR DKTAALRKKG IGPPGWTPHW FRHSHATALL LAGTAEWVVS RRLGHAHVQT 
TLDLYGWVRE DEALRAAANW TSYASNWRVT DAP