Gene Namu_5234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_5234
Symbol
ID	8450865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5835598
End bp	5837355
Gene Length	1758 bp
Protein Length	585 aa
Translation table	11
GC content	70%
IMG OID	645044265
Product	membrane protein
Protein accession	YP_003204489
Protein GI	258655333
COG category	[S] Function unknown
COG ID	[COG4425] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	73
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGACG TGACATCGAA CGAGGCAACC GCCGCGCAGG ATCGCGAACC GGTCGGAGAC 
GGGCGGTCGA ACGAGCCGGC CGAGCAGTCC GCACCGGCGT CCTCGGGTGC GGTTGCCGAC 
CGTGGTCGGC GACCGCGGTT CCGCTATACC CTGCCCGGAT CCTGGACCGC GCTGGTGTTC 
GTCTGCCTGG CGTTCACCCC GTCCCTGGTG CCCCGGCCGG GCGCGTTCCA GGGAGTGGTC 
GGCGGTTTGA CCGGCGCCAT CGGGTACGGA TTGGGCGTGG CCGGTGCCTG GGTGTGGCGG 
CAGTTCGCGG ACCGGCCGGC CCGCGCGGCA CGCCGCTGGT CGTGGTCGGC GTTCGGGATC 
GTGGCCGGCG TCGCCCTGGT CACGTCCTAC CTTCTCGGAC AGCGGTGGCA GGACCAGATC 
CGGGCGCTGG TGAACGCCGA ACCGCAGGAC CTGGGTTCTC GCCTGATCCT GCCCGTGGTA 
GCCGTTTTGG TGTTCGTCGG GCTGGTCGCC GCCGGCCGGG GGATCGCAAA GGTGTACCGA 
TGGGCGGCCC GGCGGCTGAG TCGATGGATG GGCGATCGAG CGGCCCGCGT CGTCGGCTGG 
CTGCTGGCGG CCGGGCTGAC GGTCGGCCTG GTGTCCGGGG TGCTGGTCGA CGGGGTCCTG 
GCGATCACCG ACCGAATGTT CGCCGTCCGC GACACGACGA CCAGCGACAC CGCGGTGCAG 
CCGACCACCG GCCTGCGGTC CGGTGGTCCG GGATCGCTGA TCGGCTGGGA CACGTTGGGC 
TACCAGGGCC GCAACTTCAC CGGTTCCGGT CCCACTCCCG GGCAGATCCA GGCGTTCATC 
GGTGCTCCGG CGCCCGTACC GATTCGCGCC TACGCCGGCC TTGCGTCCGC GCAGGACGTG 
CGTGACCGCG CCCGGCTGGC GGTGGCCGAC CTGCAGCGGG CCGGCGGCTT CGACCGCGGC 
CACCTGCTCG TCACCGGCAC CACCGGGACG GGCTGGGTGG ATCCGGCGGC GATCGGCGCC 
TTCGAATACG AGACCGGAGG TGACAGCGCC GCCGTGGCGA TCCAGTACTC GTACCTGCCG 
TCCTGGGCAT CCTTCCTGGT CGACCAGGAC AAAGCCCGGC AGGCCGGCCG AGCGCTGTTC 
GATGAGGTCT ATCGGGTCTG GTCCAGCCTT CCCCCCGACC ACCGGCCCAA GCTCTACGGC 
TTCGGGCTCA GCCTCGGCTC GTTCATGATG GAGTCCCCGT TCGGCGGCGA CGCGGACATG 
GCCAACCGGA CCGACGGCAT CCTGCTGGCC GGTTCGCCGG CGTTCAACCC GTTGAACCGG 
GAATTCACCG ACCAGCGGGA CGCGTTAAGT CCGGAAGTAC AGCCGGTCTA CCGCGGCGGC 
GAGACCGTCC GGTTCAGCAA CGATCCCGCG GCCTCCATCC CGCCGGACGA TGCGTCCTGG 
GACGGCGCCA GGGTGCTGTA CCTGCAGCAC GCTTCGGACC CGATCGTGTG GCTGAGCCCG 
GACCTGATTC TGCACCGGCC GGACTGGCTG GTCGAGCCGG CCGGACCTGA TGTCACCGAC 
GAGATGATCT GGATACCGTT CGTCACTTTC TGGCAGGTCA CCCTCGACAT GCTCGAACCG 
GTGGACACCC CGCCGGGGCA CGGCCACACC TACACGCTGG AGTTCGTCGA GGGCTGGGCC 
TCGGTTCTGG AGCCCCCCAA TTGGTCCCCG GCCAAATCGG AGGAACTACG CGCGTTGCTG 
ACAGAACTGC CGCACTGA

Protein sequence

MVDVTSNEAT AAQDREPVGD GRSNEPAEQS APASSGAVAD RGRRPRFRYT LPGSWTALVF 
VCLAFTPSLV PRPGAFQGVV GGLTGAIGYG LGVAGAWVWR QFADRPARAA RRWSWSAFGI 
VAGVALVTSY LLGQRWQDQI RALVNAEPQD LGSRLILPVV AVLVFVGLVA AGRGIAKVYR 
WAARRLSRWM GDRAARVVGW LLAAGLTVGL VSGVLVDGVL AITDRMFAVR DTTTSDTAVQ 
PTTGLRSGGP GSLIGWDTLG YQGRNFTGSG PTPGQIQAFI GAPAPVPIRA YAGLASAQDV 
RDRARLAVAD LQRAGGFDRG HLLVTGTTGT GWVDPAAIGA FEYETGGDSA AVAIQYSYLP 
SWASFLVDQD KARQAGRALF DEVYRVWSSL PPDHRPKLYG FGLSLGSFMM ESPFGGDADM 
ANRTDGILLA GSPAFNPLNR EFTDQRDALS PEVQPVYRGG ETVRFSNDPA ASIPPDDASW 
DGARVLYLQH ASDPIVWLSP DLILHRPDWL VEPAGPDVTD EMIWIPFVTF WQVTLDMLEP 
VDTPPGHGHT YTLEFVEGWA SVLEPPNWSP AKSEELRALL TELPH