Gene Namu_4941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4941
Symbol
ID	8450572
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5518328
End bp	5519506
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	75%
IMG OID	645043980
Product	hypothetical protein
Protein accession	YP_003204204
Protein GI	258655048
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	55
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGCAAC GCATCACCGT CGAGCAGCGC CGGGCCCGGC TCGGCCTCCG CCATGGCCTG 
GCCGCCCGAT CGGTCGGCCG CCCGGCCGGC GCGGTTGCCG CCGACGTGCT GGTACTGCAC 
GCGACCGACC CGGCCACGGT CTACCTCTCG GTGGCGGCGC GCGCGGCGGA CCTGGCTCCG 
GACGACCTGG GCCGCGCGCT GTACGAGGAC CGGTCGCTGG TCCGGATGCT GGGCATGCGC 
CGGACGATGT TCGTCGTGCC GTCGGACCTG GTGGCGCTGG TGCAGCGATC GTCGTCCGAC 
GCGGTCGCTG CTCGGCTGCG GGCGGCGCTG ATCAAGGACC TCACGGCGGT GGTGCAGGCA 
CCGGGCGCCT GGCTGGCCGA CGTGGAGGGG TCGGTGCACG AACTCGTGCG GACCACCGGC 
GGGTCGCCGG CGACGGCGCT GTCCACCGCC GAGCCGCGGC TGCGGACCAA GCTCGTCTAC 
GCCGAGGGCA AGGCCTACGG CGGGTCGAGC ACCATCACCA CCCGGGTGTT GAACCTGATG 
GCCGCCGACG GGCTGGTCGT GCGCGGGCGC ACCAAGGGTG CCTGGACCGG TGCCCAGTAC 
GAGTGGGGGC CGATCGAGAG CTGGTTCCCG AACGGCATCG CCGAGCTCGA TCCGGCGGTG 
GCTCGGGCCG GGCTGGTGCG GGCCTGGCTG GCCCGGTTCG GGCCGGCCAC GGTGGCCGAC 
GTCGCCTGGT GGACCGGGTG GAACGGCCGC GACACCAAGG CCGCGCTGGC CGCCGCCGGC 
GCCGTCGACA TCGACCTCGA CGACGGGCCC GGGGCCGTGC TCGCCGCGGA TCTGGATCCG 
GTCCCGGTCC CGGCGCCGTG GGTGGCCCTG CTGCCCGCGC TCGATCCGAC GCCGATGGGC 
TGGATCGAGC GCGACTGGTA CTTCCCGCCC GAGTTCAAAC CGCTGCTGTT CGACCGCACC 
GGCAACATCG GGCCGACCGT GTGGTGTGAC GGCCGGGTGG TCGGCGGCTG GGCGCAGCGA 
CCCTCCGGTG AGGTGGTGAC CCGGCTGCTG ACCGACATCG GCGCGGCGGC CGGCGCCGCC 
GTCGCGGCCG AGGCGGCCCG CCTGCAGGAG TGGATCGGGC CGGCCCGGGT CATCCCCAAG 
TTCCGGGTGC CGCTGGACCG CGACCTGGTC GCCGGCTGA

Protein sequence

MGQRITVEQR RARLGLRHGL AARSVGRPAG AVAADVLVLH ATDPATVYLS VAARAADLAP 
DDLGRALYED RSLVRMLGMR RTMFVVPSDL VALVQRSSSD AVAARLRAAL IKDLTAVVQA 
PGAWLADVEG SVHELVRTTG GSPATALSTA EPRLRTKLVY AEGKAYGGSS TITTRVLNLM 
AADGLVVRGR TKGAWTGAQY EWGPIESWFP NGIAELDPAV ARAGLVRAWL ARFGPATVAD 
VAWWTGWNGR DTKAALAAAG AVDIDLDDGP GAVLAADLDP VPVPAPWVAL LPALDPTPMG 
WIERDWYFPP EFKPLLFDRT GNIGPTVWCD GRVVGGWAQR PSGEVVTRLL TDIGAAAGAA 
VAAEAARLQE WIGPARVIPK FRVPLDRDLV AG