Gene Namu_1920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1920
Symbol
ID	8447527
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	2113818
End bp	2114891
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	73%
IMG OID	645041050
Product	mucin-associated surface protein (MASP)
Protein accession	YP_003201298
Protein GI	258652142
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.023187
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.000212154
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAGCAGGA GCACCGGACC GCGGTCCGCC GCACAGGATT TCGCGGCCAA GGCCGGCGAG 
ATCGCGGAAC TGGTTGCCGA CAAGGTGGCC GACGCCACCA GCGAGGCGGC CAGCAAGGCT 
GCGCACCTCG CGGGTGGGGC GGCGCACGCC GCGACGCCGT ACGTCGAGAA GGCCGGTGAG 
CAGCTCGAGG AAACCGCCGC CAAGCTGGGT CGCCGGGCTC GCCGGGCCGC GAAGAAGACG 
GCCAAGAAGT CGGCTGCGGC AACCACCAAG CAGGCCAAGA TCGTGCAGGC CAAGGCGACC 
AAGCAGGCCA AGCGGGGCCA GATCAAGGCC GCCGACAAGG CCGCCGAGAT CGCGCACGTC 
GCGCAGGAGA AGGGCCAGGC CACCCTGGTG CAGGCGCTGA CCGCGGCCAG CGCGCAGGCG 
GCCAAGGCGA GCACCGCCGC CGACAAGGCG GCCAAGAAGA CCGCCAAGGC CGGTAAGAAG 
TCGCACAAGC TGCGCAACCT GATCATCATC GGGGCCGTCG CCGGTGGCGG CGCCTACGCC 
TTCTCCAAGC TGCGCTCCGG CGGGGCCGCA CCGGCGGACA CCGCGCCGGC GCCGACCTAC 
ACCCCGCCGA CCAGGCCGGC CGACAAGCCC GCCGAGAAGG CGGCCGACAA GCTGGCGGAG 
GCCAAGGACA AGGCGGCCGA GGCGTTGGGC ACGGCCAAGG ACAAGGCCGC CGACGCGGTC 
GACGCCGCTA AGGACAAGGC CGCCGACGTG ATCGACGCGG CCAAGGACAA GGCGGCCGAC 
GCGGTCGACG CGGCCAAGGG CGCCGTCGAC AAGGCCGCCG ACACCACCGC GGACAAGGCC 
GCCGACGCGG CTGACGCGGT GGCCGACAAG GCTCCCGAGG CCGCCGACAA GGTTGCCGCC 
ACCGCCGATC AGGCCGCCGA CAAGGTCGCC GAGTCCGCGG ACAAGGCCGC CGATAAGGCC 
TCGGCTTCCG GTCGCAACCT GGCCGACGCG GCCGACAAGG CCCGGGAAGC GGTGAAGAAG 
GCCGCGGCGG AGACCGCCGA AGCGGCGAAG AAGAAGGCGG GAGAGACAGC GTGA

Protein sequence

MSRSTGPRSA AQDFAAKAGE IAELVADKVA DATSEAASKA AHLAGGAAHA ATPYVEKAGE 
QLEETAAKLG RRARRAAKKT AKKSAAATTK QAKIVQAKAT KQAKRGQIKA ADKAAEIAHV 
AQEKGQATLV QALTAASAQA AKASTAADKA AKKTAKAGKK SHKLRNLIII GAVAGGGAYA 
FSKLRSGGAA PADTAPAPTY TPPTRPADKP AEKAADKLAE AKDKAAEALG TAKDKAADAV 
DAAKDKAADV IDAAKDKAAD AVDAAKGAVD KAADTTADKA ADAADAVADK APEAADKVAA 
TADQAADKVA ESADKAADKA SASGRNLADA ADKAREAVKK AAAETAEAAK KKAGETA