Gene Namu_3611 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3611
Symbol
ID	8449230
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3966849
End bp	3968048
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	70%
IMG OID	645042681
Product	integrase domain protein SAM domain protein
Protein accession	YP_003202917
Protein GI	258653761
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.00442535
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0137307
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGATTCGT TGCCCGCGCC GCGCGATGTC GCGATGCTTC GTGTTCCAAC GATCGGCCGG 
GTCCACCGGA CTGGTCGGGG TCCGTGGGAG GTGCTGGGCG CAGACGGCGA GCCGGTGCTG 
GCGTGGGTGA GTTTCCGGGG CGAGCTTGTC GCCGGCGGGT GTTCCGCCGC GACGTGCCGT 
TCCTACGCCC ACGACATTCT GCGGTGGCTG CGTTTCCTTG CCGCGGTGGG CGTTTCGTGG 
CAGCAGGCCG GCAGGGTCGA GGTGCGCGAC TACGTGCGGT GGCTGCGCAC GGCGGCCAAC 
CCAGCCCGCG ACCGGCGCAC AGCGGCGGGT GGCCGGCCAC CGGCCGGGAC GGTGAACACC 
GCGACGGGCA AGGCCTACCT AGCGGCGGGG TATGCGCCCA GGACCATCAA CCATGCGTTG 
TCGGTGCTCA GCGAGTTCTA TCGGCACGCC GTCGACGCCG ATCTCGGCCC GTTGCGGAGC 
CCGGTGCCGC TGCGGCGGAG CGTGACCCGG TTCCCCGGCC AGTCCACGGC ACGAGCGGCT 
GTCGGCGGCC CGGCCTATCG GCAGCGGGAA CCGGTCGCTC AACCCCGCGC GCTGTCCGAG 
CCGTTGCTGC AGCGTGTGTT CGCGGCTCTG CGGCATGACC GGGACCGTGC CCTGATCGCG 
GTGGCGTTGA GTTCGGGGGC GCGGGCGAGC GAGTTGTTGT CGATGGTCCG CAACGGGATC 
GACGTCGGCT TGGGTGTGGT GTCGGTGGTT CCGAAGGGTC GACCGGGTCG GGTGTGGATA 
CCGCTGGCGC CGGAGGCGCT GGTGTTGATT GGCCGTTACC TCGCGGCGCA ACCACTGGGG 
TTACCCGACG ACCCGGTGTG GATGACGATC CGTCGGCCGG CTCATCCGTT GACGTATTTC 
GCGATGCGTC AGGTCCTGGA GCGGGTCAAC CAGGAGCTCG GCACGAACAT CACCTGGCAC 
GACTTCCGTC ACACGTTCGC GCATCGGCTG TTGGCCGACG ACCGGTTGTC ACTGACGGAT 
GTGCAGACGC TGATGCGGCA CCGCAGCCTG ACGACGTTGA CGGACTACTC CGCGGCCAGG 
TTGGACGAGT TGGTGACCCG CTTGCACGAG CACCTGGCCC GGCCGGCGCC GGCGCCCACC 
GTGGCCGTGG GCTACGACCA GGACGACATG CAGGTCCTGT TCCCGGGTTT GACACCGTGA

Protein sequence

MDSLPAPRDV AMLRVPTIGR VHRTGRGPWE VLGADGEPVL AWVSFRGELV AGGCSAATCR 
SYAHDILRWL RFLAAVGVSW QQAGRVEVRD YVRWLRTAAN PARDRRTAAG GRPPAGTVNT 
ATGKAYLAAG YAPRTINHAL SVLSEFYRHA VDADLGPLRS PVPLRRSVTR FPGQSTARAA 
VGGPAYRQRE PVAQPRALSE PLLQRVFAAL RHDRDRALIA VALSSGARAS ELLSMVRNGI 
DVGLGVVSVV PKGRPGRVWI PLAPEALVLI GRYLAAQPLG LPDDPVWMTI RRPAHPLTYF 
AMRQVLERVN QELGTNITWH DFRHTFAHRL LADDRLSLTD VQTLMRHRSL TTLTDYSAAR 
LDELVTRLHE HLARPAPAPT VAVGYDQDDM QVLFPGLTP