Gene Namu_4747 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4747
Symbol
ID	8450377
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	5280530
End bp	5281993
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	73%
IMG OID	645043787
Product	hypothetical protein
Protein accession	YP_003204012
Protein GI	258654856
COG category	[S] Function unknown
COG ID	[COG4320] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCTGC CGGGCCGGGT CGTCCCCGCC GCGCCCCGGC CGGCCGAGTT CGCCCGCGGC 
GCCCGGTCGC AGCGATCGAC CACCGAGCAG CGGCAGGCCG CCGGCCGGGC CGCCCGGACG 
ATCATGCCGT TGGCCGACCA CGCCGACCTG GGTCCCGGTG ACCGGGACCC GGTCGCGCTG 
CTGGAGGAGC AGGCGGCCAC CCGGGTTCAG CGGCTGATCC CCATCCGGTA CGGGCGCATG 
CTGGCCAGCC CGCTGACCTT CCTGCGCGGC GCGGCCCGGC TGATGGCCGT CGACCTGGGC 
GCCGGTCCCG ACTCGGGGCT GCGAGTGCAG CTGTGCGGCG ATGCCCACCT GAGCAATTTC 
GGCTTCTACG CCACTCCGGA ACGCCAGCAG GCCTTCGACA TCAACGATTT CGACGAGACC 
CATCCGGGAC CGTTCGAATG GGACGTCAAA CGGCTCGCGG CCAGTGTCGC GATCGCCACC 
CTGGTCAACG GCTTCGCCCC GAAGAAGGCC CGCACCGCGG CGCTCGCCGC GGCGGCCGGC 
TACCGCACCG AGATGAATCG GCTGGCCGGG TTGGGCACCC TGGCGGTCTG GTACGCGCAC 
CAGGACGTCG ACGGCATGCT CACCGACATC CGTTCCGAGG CCGGTGATGT CGCCGCCGAG 
CAGCTGGGTT CGGACGTGGC CAGAGCACGC TTCCACGACA GCAATCACGC CCTGCGCAAG 
CTGTGCACGA CGGTGGAAGG GCAGGTCCAG TTCCGCAACG ATCCCCCGCT GATCGTGCCC 
GCCGAGGAGC TGCTGCCGGC CTGGGGTCAG AACGTCGACG ACGCCTACGA CCTGGTCGGC 
CGGCTGGTGC GCGCCTACCG ACGCGGGCTG CAAAGCGACC GCCGGTACCT GTTCGATCAG 
TTCACCGTGG TGCAGCTGGG CTTCAAGCTG GTCGGCGTGG GCAGCGTCGG GACCCGCGCC 
TACGTGGTGC TGTTGGACGG CAGCGACGCG CAGGACCCGC TGATCCTGCA GGCCAAGGAG 
GCCCAGCCCT CGGTGCTGGC CGACCAGCGG CCCGCCCCGA CCCCGCGGCC GGCCGACGAG 
GGCAATCGGG TGGTGCACGG TCAGCGGCTG CTGCAGATGA CCAGCGACAT CTTCCTCGGC 
GCGGTCCGGG CGACCGGGAT CGACGGCGCC CGCCGCGACT ACTACGTCCG TCAGCTGCGC 
GACGGCAAGG GATCGGTGGA CGTCGACCGG CTGCGGCCCC GGGCGATGGC GTTCTACGCC 
CGGGTCTGCG GGCAGACGCT GGCCCGGGCG CACGCGCGGT CCGGGGACCG GGTGGCCATC 
GCCGGCTACC TCGGCTCCGC GGCGACGTTC GACGAGGCGA TCGCCGACTT CGCGCTGGCC 
TACGCCGATC GCAGCGTGGT CGATCACGCC GCGCTGCGGC AGGCGGCGGC CGACGGGCGA 
ATCGCGGTGC GCGAGGGCGT CTAG

Protein sequence

MSLPGRVVPA APRPAEFARG ARSQRSTTEQ RQAAGRAART IMPLADHADL GPGDRDPVAL 
LEEQAATRVQ RLIPIRYGRM LASPLTFLRG AARLMAVDLG AGPDSGLRVQ LCGDAHLSNF 
GFYATPERQQ AFDINDFDET HPGPFEWDVK RLAASVAIAT LVNGFAPKKA RTAALAAAAG 
YRTEMNRLAG LGTLAVWYAH QDVDGMLTDI RSEAGDVAAE QLGSDVARAR FHDSNHALRK 
LCTTVEGQVQ FRNDPPLIVP AEELLPAWGQ NVDDAYDLVG RLVRAYRRGL QSDRRYLFDQ 
FTVVQLGFKL VGVGSVGTRA YVVLLDGSDA QDPLILQAKE AQPSVLADQR PAPTPRPADE 
GNRVVHGQRL LQMTSDIFLG AVRATGIDGA RRDYYVRQLR DGKGSVDVDR LRPRAMAFYA 
RVCGQTLARA HARSGDRVAI AGYLGSAATF DEAIADFALA YADRSVVDHA ALRQAAADGR 
IAVREGV