Gene Namu_4433 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4433
Symbol
ID	8450060
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4918449
End bp	4919762
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	67%
IMG OID	645043480
Product	O-acetylhomoserine/O-acetylserine sulfhydrylase
Protein accession	YP_003203708
Protein GI	258654552
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.367833
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.781269
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCTCCC AGTGGTCCTT TGAGACCCGC CAGATCCATG CCGGCCAGAC CCCCGACCCG 
ACCACCAAGG CCCGGGCGCT GCCGATCTAC CAGACGACGT CCTACGCGTT CGATTCGTCC 
GAACACGGCC GCAAGCTGTT CGCCCTCGAA GAGCTGGGCA ACATCTACAC GCGGATCATG 
AACCCCACCC AGGCCGTGGT GGAGGACCGG ATCAACTCCC TCGAGGGCGG CGTCGGTGCG 
CTGCTGGTGG CCTCCGGGCA GTCGGCCGAG ACGTTGGCCA TCCTGACCCT GGCCGAGGCC 
GGGGACCAGA TCGTCTCCTC GCCGCGCCTG TACGGCGGAA CCTACAACCT GTTCCACTAC 
ACGCTGCCCA AGATGGGCAT CACCGTCGAC TTCGTCGAGA ACCCCGACGA TCCGGAGTCG 
TGGCGGGCCG CGGCCAAGCC GAACACGAAG GCGTTCTACG GCGAGTCGAT CTCCAACCCG 
GCGCTGGACG TCCTGGACTT CGCCGCCGTG TCCGCGGTTG CGCACGAGGT CGGGGTGCCG 
CTGATCGTCG ACAACACCGT GCCCAGCCCG TATCTCATCC GGCCGATCGA GCACGGCGCG 
GACATCGTGG TGCATTCGGC GACCAAGTAT CTGGGCGGTC ACGGCACCGC GATCGGTGGC 
GTCATCGTCG ACTCGGGCAA CTTCGACTGG GTCGCCAACG CCGAGCGCTT CCCGAACTTC 
AACACCCCCG ACCCCAGCTA CAACAACCTC ACCTGGGGGG TCGACCTGGG ACCGGAGGGA 
CTGTTCAAGT CCAACGTCGC CTTCATCTTC AAGGCCCGGC TGCAGGGGCT GCGCGACATC 
GGCCCGGCGA TCAGCCCGTT CAATGCCTTC CTGATCTCCC AGGGTGTGGA GACCCTTTCG 
CTGCGGGTGC AGCGGCACAA CGACAATGCG GCCCGGGTCG CCGAATTCCT GTCCGGCCGG 
GACGAGGTCG AATCGGTCTC CTACCCCGGT CTGGCGTCCA GCCCCTGGCA CCACCTGCAG 
CAGAAGTACG CGCCGCTGGG CGGTGGCCCG ATCGTCACCT TCGAGATCAA GGGCGGGGTC 
GAGGCGGGAC AGACGTTCAC CGACGCGCTG GAGCTGTTCA CCAACCTGGC CAACATCGGT 
GACGTGCGCT CGCTGGTGAT CCACCCGGCG TCGACCACGC ACGCGCAGCT GGCGCCGGCC 
GAGCAGCTGA CCACCGGCGT CACCCCAGGC CTGATCCGGT TGGCCGTCGG TATCGAGCAC 
ATCGACGACA TCCTGGCCGA CCTGGAGGCC GGCTTCCGGG CCGCCAAGGG GTGA

Protein sequence

MSSQWSFETR QIHAGQTPDP TTKARALPIY QTTSYAFDSS EHGRKLFALE ELGNIYTRIM 
NPTQAVVEDR INSLEGGVGA LLVASGQSAE TLAILTLAEA GDQIVSSPRL YGGTYNLFHY 
TLPKMGITVD FVENPDDPES WRAAAKPNTK AFYGESISNP ALDVLDFAAV SAVAHEVGVP 
LIVDNTVPSP YLIRPIEHGA DIVVHSATKY LGGHGTAIGG VIVDSGNFDW VANAERFPNF 
NTPDPSYNNL TWGVDLGPEG LFKSNVAFIF KARLQGLRDI GPAISPFNAF LISQGVETLS 
LRVQRHNDNA ARVAEFLSGR DEVESVSYPG LASSPWHHLQ QKYAPLGGGP IVTFEIKGGV 
EAGQTFTDAL ELFTNLANIG DVRSLVIHPA STTHAQLAPA EQLTTGVTPG LIRLAVGIEH 
IDDILADLEA GFRAAKG