Gene Namu_2299 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_2299
Symbol
ID	8447910
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	2540188
End bp	2541183
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	77%
IMG OID	645041421
Product	hypothetical protein
Protein accession	YP_003201665
Protein GI	258652509
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.0560687
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.00265878
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGACGCGG CCCCGCAGGA GCTGCCGCCG AATCCGGGGG CCCCACCCCG GACGGCCGAT 
CCGACCCGCC TGGACGCGGC GCTGAGCACC CTGGAGCTGA CCGTCCGGCG CCGCCTGGAC 
GGGCTGCTGC AGGGCAACCA CCTGGGCCTG GTGCCGGGTC CGGGGACCGA ACCGGGCGAC 
GCCCGGCCGT ACTACCCGGG CGACGACGTG CGCCGGATGG ACTGGTCGGT GACCGCGCGG 
ACCACCGAGC CGCACATCCG GCAGACCGTC GCCGACCGTG AGCTGGAGAC CTGGCTAGTG 
GCCGACCTGT CGGCCTCGCT GGACTTCGGC ACCGTCGGCT GCGAGAAGCG GGACCTGGTG 
GTCGCCGCCG CGGCCGCGGT CGGGCACCTG ACCCGGGGCG GCGGCAACCG GATCGGGGCC 
ATCGTGGCGT CCGGCTCGCA GCTGGCCCGG GTGCCGGCCC GCGGCGGCCG CCCGCACCTG 
GAGTACCTGC TGCGCACGCT GGCCAACAAC CCCCGGGCCA CTCCGGGCGA CCGGGGTGAC 
CTGGCCACCG CGCTGGAGCA GCTGCGGCGC CCGCCGCGGC GGCGGGGTCT GGTCGTGGTC 
ATCTCCGACT TCATCGGCCC GGTGGACTGG GAGCGCCCGC TGCGCGGCCT GTCCGCCCGG 
CACGACCTGC TCGCCGTCGA GGTCATCGAC CCCCGCGACC TGGAGTTGCC GGCCGTCGGC 
CTTGTCACCC TGGTCGACCC GGAAACCGGT CGCAGCAAGG AGGTCTCGAC CAGCGCCGGG 
CTGCGGGCGG CCTTCGCCAA GGCCTCCGCC GAGCACCGTG CGCAGGTGGC CGGGGCGCTG 
CGGCGGGCCG GCGCGGCCCA GCTGGTCCTG CGCACCGACG GCGACTGGAT CGCCGACGTG 
TTGCGGTTCA TCGTGGGCCG CAAGCGTGGC TGGACCGGGG CCACCGCCCC CGGCACCCCC 
AACCGCACGC CCCGCGGCGG GGAGGCCTGG CAGTAA

Protein sequence

MDAAPQELPP NPGAPPRTAD PTRLDAALST LELTVRRRLD GLLQGNHLGL VPGPGTEPGD 
ARPYYPGDDV RRMDWSVTAR TTEPHIRQTV ADRELETWLV ADLSASLDFG TVGCEKRDLV 
VAAAAAVGHL TRGGGNRIGA IVASGSQLAR VPARGGRPHL EYLLRTLANN PRATPGDRGD 
LATALEQLRR PPRRRGLVVV ISDFIGPVDW ERPLRGLSAR HDLLAVEVID PRDLELPAVG 
LVTLVDPETG RSKEVSTSAG LRAAFAKASA EHRAQVAGAL RRAGAAQLVL RTDGDWIADV 
LRFIVGRKRG WTGATAPGTP NRTPRGGEAW Q