Gene Nmul_A0301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0301
Symbol
ID	3785334
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	325227
End bp	326288
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	55%
IMG OID	637810377
Product	polysaccharide deacetylase
Protein accession	YP_411001
Protein GI	82701435
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0726] Predicted xylanase/chitin deacetylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.351436
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCCTTGTT TGCTTGCTGC TCGTGTCCGC TTTTCTTCCA TGAGAACTTC TGAATATGAT 
CACGTGGACA ATCTGGTAAA TCAGGTGCCA CTTTGGCCGC TGTTGACGAG CCGTGCGATG 
TTGCATCTGC TTTCCCCCGG GGGGCGGCGC GCCCGCCTGT CCATACTGAT TTATCATCGG 
GTGCTGCCCT GCCAGGATCC ACTTTTTCCG GAGGAGAGTC ATGCCCGGTC CTTCGATCAG 
CAGATGGAGC AGCTTGCGGC CTGTTTCAGG GTCATATCTC TCGGGGAGGC GATTCGCGGC 
CTTCGTAATG GAACGCTGCC CCCACGTGCT GCCTGTGTCA CTTTCGATGA CGGTTATGCC 
GATAATGCGG AAATCGCTTT GCCGATTCTG AAAAAACGCG GTATTCCTGC TACTTTTTTC 
GTGGCAACCG GTTTTCTCGA CGGAGGCCGG ATGTTCAACG ATACCGTGAT AGAATTGATA 
CGGGGTGCGC CGGGAAGCAC CGTGGATCTT GATAGCCTGG GCTTGGGAAG GTTTCCGATC 
GGAACTGTTT CCGAGCGTCG TCAAACTATT CACCAGTTAT TGGGCAAGCT CAAGTATCTG 
CCCTCCGCAT TACGGCAATC GACCGTGGAG GCAATGTCGG CGTCAATTCC AGTCATGCTG 
CCTGACAATC TCATGATGAC CTCCGAGCAG GTCAGAATGA TGCACAATGC AGGAATGGAA 
ATAGGTGGGC ATACCGCCAG TCATCCCATC CTGGCAAAAA TGGAGAGCAG AGCAGCTTGT 
GCTGACATTG CCACCGGCAA AGAGATGCTG GAGGCCATTA TTCGCGCTCC GGTGCGGTTT 
TTTGCCTACC CGAATGGGAA GCCGGGGAGA GACTATTTGC CCGATCACGT CCGGATGGTA 
AAGAAGCTGG GGTTTGACGC GGCAGTCTCG ACTGCCCATG GAGCAGCAAG AAAAGGAAGC 
GACCTCCATC AGCTCCCTCG GTTTACTCCC TGGGATAGGC GCCCGCTGCG ATTCGCCCTT 
CTGATGGCGC GAAATATGCT GAAAACTGGA GAAACAGTTT AA

Protein sequence

MPCLLAARVR FSSMRTSEYD HVDNLVNQVP LWPLLTSRAM LHLLSPGGRR ARLSILIYHR 
VLPCQDPLFP EESHARSFDQ QMEQLAACFR VISLGEAIRG LRNGTLPPRA ACVTFDDGYA 
DNAEIALPIL KKRGIPATFF VATGFLDGGR MFNDTVIELI RGAPGSTVDL DSLGLGRFPI 
GTVSERRQTI HQLLGKLKYL PSALRQSTVE AMSASIPVML PDNLMMTSEQ VRMMHNAGME 
IGGHTASHPI LAKMESRAAC ADIATGKEML EAIIRAPVRF FAYPNGKPGR DYLPDHVRMV 
KKLGFDAAVS TAHGAARKGS DLHQLPRFTP WDRRPLRFAL LMARNMLKTG ETV