Gene Namu_4622 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4622
Symbol
ID	8450250
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5143727
End bp	5144962
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	60%
IMG OID	645043663
Product	Restriction endonuclease S subunits-like protein
Protein accession	YP_003203890
Protein GI	258654734
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.156513
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGCG ATCTCACTAC GCTCGGAGCT GTTGTTAAGG CCACCGGGGG CGTCCTCCAA 
ACCGGGCCCT TCGGAAGTCA GCTTCACGCC AGTGACTACC AGTTCACCGG CAAACCACTC 
GTAATGCCGG TGAATCTCGG AGACAACGAA ATCCGGGAGG CTGGCATTGC GCGCATCGGG 
GTTGAGGACG CTCACAGACT GCGTCGCCAT GCTCTGCGGG AGGGCGACAT CATTTTCAGC 
AGGAGAGGAG ACGTTGGTCG TCGATCCCTC GTGCGGACGA GAGAGGCGGG TTGGCTCTGC 
GGGACAGGCT GCCTCGCGGC TCGATTTGGA AGTGACCGGA CGACGGTCAA TCCGGCGTAC 
GTCGCTGACT ACCTTGGAGG GACGTCGGCG CAGGCATGGC TCGTCGACAA TGCCGTTGGC 
GGGACCATGC CCAACCTGAA TACAAGCATT CTTTCGGCAT TACCCGTGTG GCTACCGTCG 
AAATTGGAGC AGGACCGTAT TGTTGCCGCG CTTGAAGATG TCCGGAAAGT GATCGATTCC 
ATCCAGCACC TTATCGCCAA GAGGCAGGCG ATCAAGCAAG GCATGATGCA GCATCTCCTT 
ACGGGTCGAA CGCGGCTCCC AGGTTTCAAC GAGGCATGGA GCGAGACAAC GCTCGGAGCT 
GTCGCACGTT TCAGCAAGGG TGCGGGACTT CCGAAGGCGG CTCTGACATC TTCTGGCTCG 
ACCCTGTGTA TTCATTACGG TGAGCTATTC ACGTTCTACG GTCCCGAAAT CCGTCAGGTT 
TTCAGCCGAA CAACGCCTAC CGGACGCGTG GTCGTGTCTG AGGACCTCGA TGTCCTGATG 
CCTACGTCCG ATGTGACACC ACGCGGACTG GCTAAAGCCA GTGCGATCCA CGGCGCCGGA 
GTCGTATTGG GCGGCGACAT CCTTATCATT CGACCTGACA AGGCACATGC TCATGGCCCG 
TTCGTCGCTC ACGCCATTCG GCATCACGCG GACCAAGTGC TCCAGCTCGT GCGCGGGTCC 
ACTGTCTACC ACCTGTATGC CACTGACATG CGAAATTTCG CGCTCTCGCT CCCGTCGGTG 
AATGAGCAGC GTGCGATCGC CGGCGCACTG CTTGACGCCG ATCGACAACT CGAAGCGTTG 
GAGGAGCGTC TGATGAAGGC TCGCGCCTTC AAGACCGGAA TGATGCAGCG CCTCCTGACT 
GGACATACGC GCTTGCCGAC GGAGGCCGCG ACATGA

Protein sequence

MSGDLTTLGA VVKATGGVLQ TGPFGSQLHA SDYQFTGKPL VMPVNLGDNE IREAGIARIG 
VEDAHRLRRH ALREGDIIFS RRGDVGRRSL VRTREAGWLC GTGCLAARFG SDRTTVNPAY 
VADYLGGTSA QAWLVDNAVG GTMPNLNTSI LSALPVWLPS KLEQDRIVAA LEDVRKVIDS 
IQHLIAKRQA IKQGMMQHLL TGRTRLPGFN EAWSETTLGA VARFSKGAGL PKAALTSSGS 
TLCIHYGELF TFYGPEIRQV FSRTTPTGRV VVSEDLDVLM PTSDVTPRGL AKASAIHGAG 
VVLGGDILII RPDKAHAHGP FVAHAIRHHA DQVLQLVRGS TVYHLYATDM RNFALSLPSV 
NEQRAIAGAL LDADRQLEAL EERLMKARAF KTGMMQRLLT GHTRLPTEAA T