Gene Namu_2971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_2971
Symbol
ID	8448584
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3255746
End bp	3257257
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	71%
IMG OID	645042056
Product	protein of unknown function DUF245 domain protein
Protein accession	YP_003202298
Protein GI	258653142
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0494873
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0174629
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGTGC GTCGCATCAT GGGCACCGAA GTCGAGTACG GCATTTCGGT GCCGGGCGAG 
CCGGGCGTGA ACCCGGTGAT CTCCTCCACC CAGGTGGTCC TGGCCTACGC CGCCTCGGTG 
GCCGCGCCCC GGGCCCGCCG GCCCCGGTGG GACTACGAGG TGGAATCGCC GCTGCGGGAC 
GCCCGCGGGT ACGACCTGTC CTCGCTGTTC GGGGCGGCCG AACCGGACGT GGACGACATC 
GGTGCGGCCA ATGTGATCCT GTCCAACGGG GCCCGCCTGT ACGTCGACCA CGCCCACCCG 
GAGTTCTCCG CCCCCGAGGT GACCAACCCG CTGGACGCCG TGCTCTACGA CAAGGCCGGC 
GAGCGGGTGA TGGAGACGGC GGCCCGGCTG GCCGCCTCGC TGCCCGGGTC CAAGCCGATC 
CAGATGTACA AGAACAACGT CGACGGCAAG GGCGCCTCCT ACGGCACCCA CGAGAACTAC 
CTGTGCAGCC GGGACACCCC GTTCCCGGCG ATCATCGCCG GCCTCACCCC GTTCTTTACC 
ACCCGGCAGG TCTTCGCCGG CGCCGGGCGG GTGGGCATTG GGCCGGCCGG GCAGACCGAG 
GGCTTCCAGC TCGGCCAGCG CAGCGACTAC ATCGAGGTCG AGGTCGGCCT GGAGACCACT 
CTCAAGCGCG GCATCATCAA CACCCGCGAC GAGCCGCACG CCGACGCCGA CAAGCACCGC 
CGCCTGCACG TGATCATCGG GGACGCGAAC CTGGCTGAGA TCGCCACCTA CCTCAAGGTC 
GGCACGGCAG CCCTGGTGCT GGCCATGATC GAGTCCGGCT GGGCGCTGCC GTCGGTCGAG 
CTGGCCCACC CGGTGGCGGC GGTGCACCAG ATCTCGCACG ACCCGACGCT CAAGGTCACC 
GTCCCGCTCA CCGACGGCCG CCGGCTGACC GGGGTGGACG TGCAGCGGGC CTACCACGAG 
GCGGCGGCCA AGTACGTCGA GGCCGAGTAC GGCGATGACG TCGACGAGCA GACCCGGGAC 
GTGCTGGACC GCTGGATCAG CGTGCTGGAC CGGCTGGCCC ACGACCCGAT GGACCTGGCC 
TCCGAGCTGG ACTGGCCGGC CAAGCTGCGG CTGCTGGAGG GCTATCGCAG CCGCGACGGG 
CTGGCCTGGG GCGCCGGCCG GCTGGCCCTG ATCGACCTGC AGTACTCCGA CGTGCGGATG 
GACAAGGGTC TGTACAACCG GCTGGTCTCC CGCGGGTCGA TGCAGCGGCT GGTCACCGAG 
GAGCAGGTGA CCGCGGCGAT GACCGATCCG CCCGAGGACA CCCGCGCCTA CTTCCGCGGC 
CGCTGCGTGT CCAAGTACGC CGACCGCCTG GCCGCGGCGT CCTGGGACTC GGTCATCTTC 
GACATCGGCC GGGAATCGCT GGTGCGCATC CCGACCATGG AGCCCACCCG GGGCACCAAG 
GCGCACGTGG GGGCCCTGCT GGACGCCGCC GCGGACGCGA CCGAACTGGT CGACGCACTC 
ACCCGCCGGT GA

Protein sequence

MSVRRIMGTE VEYGISVPGE PGVNPVISST QVVLAYAASV AAPRARRPRW DYEVESPLRD 
ARGYDLSSLF GAAEPDVDDI GAANVILSNG ARLYVDHAHP EFSAPEVTNP LDAVLYDKAG 
ERVMETAARL AASLPGSKPI QMYKNNVDGK GASYGTHENY LCSRDTPFPA IIAGLTPFFT 
TRQVFAGAGR VGIGPAGQTE GFQLGQRSDY IEVEVGLETT LKRGIINTRD EPHADADKHR 
RLHVIIGDAN LAEIATYLKV GTAALVLAMI ESGWALPSVE LAHPVAAVHQ ISHDPTLKVT 
VPLTDGRRLT GVDVQRAYHE AAAKYVEAEY GDDVDEQTRD VLDRWISVLD RLAHDPMDLA 
SELDWPAKLR LLEGYRSRDG LAWGAGRLAL IDLQYSDVRM DKGLYNRLVS RGSMQRLVTE 
EQVTAAMTDP PEDTRAYFRG RCVSKYADRL AAASWDSVIF DIGRESLVRI PTMEPTRGTK 
AHVGALLDAA ADATELVDAL TRR