Gene Namu_5123 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_5123
Symbol
ID	8450754
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5709281
End bp	5710309
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	73%
IMG OID	645044158
Product	protein of unknown function DUF470
Protein accession	YP_003204382
Protein GI	258655226
COG category	[S] Function unknown
COG ID	[COG2898] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGCCGC ACTCACCGAG CCGGCCGTCC GCTGATCAGG CCGCGCTGGA CCGCCGGGTC 
GCGCTGCTGG CCGCGTACGC CGACAACCAC TCGGCGTTCC TGACCGTCAA CCGGGACACC 
GAGTACTTCG AGATCGCCGA GGTCGACGGC TTCGTCGCCT ACCGGCGGTC CGGCCGGACC 
CGGGTGCAGT TCGGCGGGGT GGTCGCCGCA CCCGACCGGC AGGCGCCCCT GCTCGAGGCC 
TTCCTGGCCG ACGCCCGGTC GGCCGGGGAG CGGACGCTGG CCGTCCAGCT CACCCCCGCG 
GACCTGCCGC TGTTCGGCCG GTCCGGGTAC CGGATCAACC AGCTGGGCAG TTCCTACGCC 
CTGGAGCTGA GCCGATACTC GCTGGCCGGC AAGCACTTCG TGCCACTGCG CAACAAGATC 
TCCCGGGCCC GGCGGGCCGG CGTGCAGGTG GCCGAAGTGG GGGTGGATCG GCCGGCCACC 
GCCGACCTGA CCGCCCAGCT GGCCGCGTTG GACCGGCAGT GGTTGCGCAG CAAGGGATCG 
CACGAGCTGG CGTTCATGAT CGGCGAGCGG TCCGGCCCGG CCGACCGGTA CCGGCGGCTG 
TTCGTGGCCG AGCGGGACGG CCAGGTCCTG GGCTACATCA GCTTCTCGCC GGTGCCCGGA 
ACGCGGCCTG GGTGGCTGCA CGACCTGACC CGCCGGCATC CCGACGCCCC GCCCGGGGTG 
ATGGAGCTGA TCGTCAGCGA CGCGGTCGGC CGGATGCGGC ACCGGGCCGA ACCGGGCTGG 
CTGCACTTCG GTTTCACCCC GTTCGTCGGG CTGGACCAGC GGCATCGGGT GGCCGGAGGG 
TCGCCCGCGG TCGACCACGT CGTCGGCCTG CTCGCCCGCC GCGGCGGGAA GCTGTATCCC 
GCCGCCGATC AGGTGGCCTA CAAGCTCAAA TGGCGCCCGC ACCTGATTCA GCCCGACTAC 
CTGGCCTTCC ATGGCCGGCC CAGTGTCGGC GCGGTCGCCC GACTGCTGCG CCTGACCCGG 
GTCATCTGA

Protein sequence

MRPHSPSRPS ADQAALDRRV ALLAAYADNH SAFLTVNRDT EYFEIAEVDG FVAYRRSGRT 
RVQFGGVVAA PDRQAPLLEA FLADARSAGE RTLAVQLTPA DLPLFGRSGY RINQLGSSYA 
LELSRYSLAG KHFVPLRNKI SRARRAGVQV AEVGVDRPAT ADLTAQLAAL DRQWLRSKGS 
HELAFMIGER SGPADRYRRL FVAERDGQVL GYISFSPVPG TRPGWLHDLT RRHPDAPPGV 
MELIVSDAVG RMRHRAEPGW LHFGFTPFVG LDQRHRVAGG SPAVDHVVGL LARRGGKLYP 
AADQVAYKLK WRPHLIQPDY LAFHGRPSVG AVARLLRLTR VI