Gene Nmul_A1558 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1558
Symbol
ID	3785280
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1788374
End bp	1789318
Gene Length	945 bp
Protein Length	314 aa
Translation table	11
GC content	55%
IMG OID	637811646
Product	histone deacetylase superfamily protein
Protein accession	YP_412253
Protein GI	82702687
COG category	[B] Chromatin structure and dynamics [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0123] Deacetylases, including yeast histone deacetylase and acetoin utilization protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.643913
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGACCCG CTTCCCATAC CGCTTTCATT TCCCATCCGG ATTGCCTGTT GCACGAAATG 
GATTTTTATC ATCCTGAGAG TCCAGCGCGG CTGAAGGCGA TCGAGGACGA GCTGTCTGCT 
TCAGGACTGA TGGATAAACT TAGACGCTAT CAGGCGCCAT TAGCGACTGT CGGCCAACTG 
GAGCGTGTGC ATACACGGGA GCATATTGCA AGGTTGCACG CTGCAGCATC CCGCGCGGCT 
TCGGGAGGTT TCGTCTACCT TGATCCGGAT ACCGCCATGA ACCGCCACAG CCTTGGAGCA 
GCTTATCGGG CCGCGGGGGC TGTTGTCCTC GCTGCCGATC TCGTGATAGA AGGAGCGGCG 
GAAAATGCAT TTTGCAGTAT TCGTCCCCCG GGTCACCACG CGGAACGCGG ATACCCGATG 
GGTTTCTGCC TGTTCAACAA TATTGCCGTA GCGGTTGCTC ACGCGCTTGA AACACATGCT 
CTGAAACGTG TCGCGGTGGT GGACTTCGAC GTGCATCACG GCAACGGTAC GGAAGATATC 
TTTCAGCACG ATCCCCGCGT CATGATGGTC TCGACATTTC AGCACCCGTT CTATCCATAT 
AGCGGCATCG CAGGCCGTTC AGAGCGAATG GTCAACATCC CGCTGCCAGC GGGGAGCAAC 
GGCAAGGTAT TTCGCAAAGC AGTGGATGAA TTCTGGTTGC CGGCGCTGGA AAGGTTTAAA 
CCGCAAATGT TGTTTGTTTC TGCTGGTTTC GATGCTCATG CCGATGATGA GCTTGCTTCT 
CTGAATCTGG TGGAAGACGA TTACGCGTGG GTAACTGAAA AAATCAAAGA GGTTGCCCGC 
GCTTATGCCG GGAAACGTAT CGTATCGGTG CTGGAAGGCG GGTATGCGTT GGCTGCGCTG 
GCACGAAGCG TGGCAGCGCA TATAGAAGTC CTTATGAAGC CCTGA

Protein sequence

MRPASHTAFI SHPDCLLHEM DFYHPESPAR LKAIEDELSA SGLMDKLRRY QAPLATVGQL 
ERVHTREHIA RLHAAASRAA SGGFVYLDPD TAMNRHSLGA AYRAAGAVVL AADLVIEGAA 
ENAFCSIRPP GHHAERGYPM GFCLFNNIAV AVAHALETHA LKRVAVVDFD VHHGNGTEDI 
FQHDPRVMMV STFQHPFYPY SGIAGRSERM VNIPLPAGSN GKVFRKAVDE FWLPALERFK 
PQMLFVSAGF DAHADDELAS LNLVEDDYAW VTEKIKEVAR AYAGKRIVSV LEGGYALAAL 
ARSVAAHIEV LMKP