Gene Namu_1923 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1923
Symbol
ID	8447530
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	2117764
End bp	2118903
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	74%
IMG OID	645041053
Product	nuclease SbcCD, D subunit
Protein accession	YP_003201301
Protein GI	258652145
COG category	[L] Replication, recombination and repair
COG ID	[COG0420] DNA repair exonuclease
TIGRFAM ID	[TIGR00619] exonuclease SbcD

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.0918656
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.000244242
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGCGCCTGC TGCACACCTC GGACTGGCAC CTCGGTCGCA CCTTCCACGG GCAGAATCTG 
CTGCCCGACC AGGAAGCGGT GCTCACCGCG CTCGCCGACC TGGCCGCGGA GCACCGGGTC 
GACGCCGTCC TGATCTCCGG CGATCTGTAC GACCGGGCGG TGCCGTCGCC GGAGGCCGTG 
CAGACCGCGT CCCGGATCCT GGCCCGGATC CGGGCGGCCG GCATCACCGT CGTCGCGATC 
GCCGGGAACC ACGACTCGGC GCCCCGCCTG GGCGCCTTCA CCGACTTCCT GGCCGCCGGC 
GGCCTGCACC TGGGCGCCGC GGCCGCCGAC GTCGGCACCC CGGCCGTGCT GCCCGATCCC 
GACGGCGACG TCGTCATCTA CCCGATCCCG TTCCTGGAAC CGGATCTGCT GCGCTCCGGA 
TGGGCGCTGC CGGCCGGATC CGGGCACGAA GCGGTGCTGG CCCGGGCCAT GGACCTGGTC 
CGCGCCGACC TGGCCGCGCG GCCGCCGGGC ACCCGATCGG TGGTGCTGGC CCACGCCTTC 
GTCGTCGGTG GCCGCGCCGG CGGATCGGAA CGATCGATCG CGGTCGGCGG GGTGGAGTCG 
GTCAGCGCGG ACCTGTTCGC CGGATTCGAC TATGTCGCCC TGGGCCACCT GCATCGCCCC 
CAGGTGCTGG CCGACCGGAT CCGCTACTCG GGATCCCCCT TGCCCTACTC GTTCTCCGAA 
GCCGATCACG AGAAGGGCGT GTGGCTGGTC GATCTGGACG CCGTCGGCGG GGTCAGCGCG 
ACCCGGCTGA CCCTGCCGAC GATCCGCCGG CTGGTCTGCC GGCGCGGCCG CCTGGCCGAG 
ATCCTGGACA CCGAGCCCGA TCTGGCCGAT GCTTATCTCT CGGTCGAGCT CACCGATCCG 
GTGCGGCCGG TGGACCCGAT GCGGCGGCTG CGGGAGGTCC TGCCCTACAC GCTGGTCGCC 
ACCTGGGTCG GCGGTTCCCC GGCGCCGGCC GCGTGGCCGG CCGCCCCCGC GGTCCCGACC 
GGCCACGACG ACGCCGACCT GCTGCACGAT TTCGTCCGCG ATGCCTGCGG GCGGCCGGCA 
TCGACGGCCG AACGCGACCT GCTGGACGAG GCCCTGCGCG CGTTGCGGAT ACCGGCATGA

Protein sequence

MRLLHTSDWH LGRTFHGQNL LPDQEAVLTA LADLAAEHRV DAVLISGDLY DRAVPSPEAV 
QTASRILARI RAAGITVVAI AGNHDSAPRL GAFTDFLAAG GLHLGAAAAD VGTPAVLPDP 
DGDVVIYPIP FLEPDLLRSG WALPAGSGHE AVLARAMDLV RADLAARPPG TRSVVLAHAF 
VVGGRAGGSE RSIAVGGVES VSADLFAGFD YVALGHLHRP QVLADRIRYS GSPLPYSFSE 
ADHEKGVWLV DLDAVGGVSA TRLTLPTIRR LVCRRGRLAE ILDTEPDLAD AYLSVELTDP 
VRPVDPMRRL REVLPYTLVA TWVGGSPAPA AWPAAPAVPT GHDDADLLHD FVRDACGRPA 
STAERDLLDE ALRALRIPA