Gene Nmul_A0634 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0634
Symbol
ID	3785407
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	722327
End bp	723550
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	54%
IMG OID	637810716
Product	BNR repeat-containing glycosyl hydrolase
Protein accession	YP_411333
Protein GI	82701767
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGCCC TCCCTGGTTT TGCCGGACTC TTTCTAGCGC TTGTTTCCGT AGCTGTCGTC 
GCAGCAGAAC CGCATTCGAG CGGTGAAACC CATCATCATC CGGCAATGCA TTCCGCAAAA 
TCCGTCAAGA CTGCGCTGGC GGTGGGAGTG ACGCTGGATC AGGATGGGCG ATTATGGCTG 
GCGAGAGTTG TCGACCAGCA TTTGCTGGTT TCCTGGTCGG AAGATAGCGG AAGCAGTTTT 
TCCGAACCCG CGGTCGTAAC ACCTGAACCG GAAAACATCT CCATCGATGG CGAGAATCGC 
CCCAAGATCG AGGTTGCGCG TGATGGCAGC GTACTTGTAA CCTGGACGCA GGTTCTTCCG 
CAAAAATATT CCGGCAATGT GAGGTTTTCA CGTTCAATCG ACTCGGGCCG GACGTTTTCA 
AAACCCATTA CCCTCAATGA CGATGGCCGC GTTACCAGTC ACCGCTTCGA CTCTCTGGCA 
ATCGACGGGG ACGGGAGGGT GATAGTTGCT TGGCTGGACG CAAGGGATCG CGATGCAGCA 
AGGGAAAAAG GCGAAGAGTA CCGGGGTGTA TCGCTCTATA CCACGCAATC ATTCAACAAT 
GGCGAGAGTT TTGGCCGGAA TCGAAGAATC CAGGAGCACA CGTGCGAATG CTGTCGGACG 
GCGCTTATCT GGAGCAGGGA GGGGCCAATC GTTTTACTGC GGAATATTTT TGGTGCCAAT 
ACCCGTGATT TTGCGCTGAT CAATCTCGAC AAGGGCGGCA TAAGAAGGGT AAACCGTGAC 
GAATGGCAGG TCGATGCGTG TCCGCACAAT GGAGGAAGCC TTGCAACGGA CCGAAGGGGC 
CAGTTGCATC TCGTCTGGTT CACAAATGGC CCGGCAGATC AGGGATTATT CTATAAGCGG 
ATCGATGGCA ATTGGGAATC GAAACCCAAG CCGATAGGCA ATGCGGACGC GCAGGCAAAT 
CATGCTTCCG TGGTTGCCGA TGGAGAAACC GTCATTCTTA CCTGGCGTGA ATTCGATGGA 
AATGCTTATT CCGCAAAGAT GATGTACTCG AATGATAGTG GCGAATCTTG GAGTGAACCG 
ATGCGCCTGA TGGAATCCGA TGGCGCGACA GACTACCCTA TCCCGCTGAT CGATAACAGG 
AAAGTTCTGA TCGTCTGGAA TACTGCAAAG GAAGGCCTGC GTATTTTACC GATCGAGCGG 
GTGACCGCCC GGTATTCCGG TTAG

Protein sequence

MFALPGFAGL FLALVSVAVV AAEPHSSGET HHHPAMHSAK SVKTALAVGV TLDQDGRLWL 
ARVVDQHLLV SWSEDSGSSF SEPAVVTPEP ENISIDGENR PKIEVARDGS VLVTWTQVLP 
QKYSGNVRFS RSIDSGRTFS KPITLNDDGR VTSHRFDSLA IDGDGRVIVA WLDARDRDAA 
REKGEEYRGV SLYTTQSFNN GESFGRNRRI QEHTCECCRT ALIWSREGPI VLLRNIFGAN 
TRDFALINLD KGGIRRVNRD EWQVDACPHN GGSLATDRRG QLHLVWFTNG PADQGLFYKR 
IDGNWESKPK PIGNADAQAN HASVVADGET VILTWREFDG NAYSAKMMYS NDSGESWSEP 
MRLMESDGAT DYPIPLIDNR KVLIVWNTAK EGLRILPIER VTARYSG