Gene Namu_3860 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3860
Symbol
ID	8449479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4231291
End bp	4232343
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	73%
IMG OID	645042908
Product	protein of unknown function DUF21
Protein accession	YP_003203144
Protein GI	258653988
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.00358184
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGTCCG GCACCGGGTG GGCGATCGTG GCCACCGTCG CGCTGATCGC GTTGAGCGCC 
TTCTTCGTCG CCGTCGAGTT CGCCCTACTG GCGGCCAAGC GACACCGGTT GGCCGACGCC 
GCGCCGCGCA GTCGCTCGGC CCGGGCGGCC GTGCGCAGCT CGGCCGAGCT GACCGTGGTG 
CTGGCCGGGT CGCAGCTGGG CATCACCGCC TGCACGCTCG CGCTGGGTGC GGTCACCAAG 
CCGGCGGTGC AGGACCTGCT GGCCGGACCG CTGCGCGCAC TGGCCCTGCC GTTGTGGCTG 
GCCGACGCGT CCGCGTTCGT GCTGTCCCTG CTCATCGTCA CCTTCCTGCA CCTGGTGATC 
GGCGAGATGG CCCCCAAGTC GTGGGCGATC GCGCACCCGG AGCGGTCGGC GATCCTGCTG 
GCCCTGCCGA TGCGCGCGTT CATGGCGGTG TTCCGGCCGG TGTTGACCGC GCTGAACGCC 
CTGGCCAACC GGTGCGTGCG GCTGATCGGC ATCGAGCCGG TGGCCGAACT GGCGACCGGG 
CAGAACCCGC AGGCGCTGCG CCAACTGGTC GAACACTCGG CGCAGGCCGG GACCCTGGAC 
GAGGACTATT CGCAGCGTCT GGCCCGGGCG TTGGACCTGC TTGCACTGAC CATCGGCGCG 
CTGGTGCGCA GCGACGGGCC GGCGACCCGG GTCGGCGCCG CGGCCACCGT GCGCGACGTG 
CAGCGGGTCG GCCGGCAGTC CGGTCACCTG CGCATCCTGG TCGGTGACGG TCCCGACCTG 
CGGCAGGTGG TGCACGTCCG CGACACCCTG ACCGCGCCGC CCGACGCGCC GGCCACCGCC 
TTCGCCAGGC CCGTGTTCGT GCTGGCCGCG TCGACCCCGT TCGCCCAGGG ACTGGAGGAG 
ATGCGGCGGG GCCGCAACCA TCTCGCCGTG GTGGTGGACG AGCAGGGACG GTTCGTCGGG 
GTCCTCACCC TGGCCGACCT GCTGCGCCGC TTGTTCCCGG AGACGGACCG TTCCGGGCTC 
ACCACCCAGC CCCCGGCCGC CCAGGTCTCT TAG

Protein sequence

MMSGTGWAIV ATVALIALSA FFVAVEFALL AAKRHRLADA APRSRSARAA VRSSAELTVV 
LAGSQLGITA CTLALGAVTK PAVQDLLAGP LRALALPLWL ADASAFVLSL LIVTFLHLVI 
GEMAPKSWAI AHPERSAILL ALPMRAFMAV FRPVLTALNA LANRCVRLIG IEPVAELATG 
QNPQALRQLV EHSAQAGTLD EDYSQRLARA LDLLALTIGA LVRSDGPATR VGAAATVRDV 
QRVGRQSGHL RILVGDGPDL RQVVHVRDTL TAPPDAPATA FARPVFVLAA STPFAQGLEE 
MRRGRNHLAV VVDEQGRFVG VLTLADLLRR LFPETDRSGL TTQPPAAQVS