Gene Nmul_A0432 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0432
Symbol
ID	3785900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	479234
End bp	480280
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	57%
IMG OID	637810508
Product	glycosyl transferase family protein
Protein accession	YP_411132
Protein GI	82701566
COG category	[R] General function prediction only
COG ID	[COG1216] Predicted glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGGCGA TGCCCCCCAT CGATGTGGTG ATTCCCGTCT ATAATGCACC AGCGTTGACA 
CGGCGCTGCA TCGATTCGGT CGTTGCCTGC CTGAGCCCAT CCATACGCTT CATTTTCATT 
CAGGACGACG CGTCGGGAAT GGAAACCCAT GCCATGCTGG ATCAATTGCC GCGCGGGCGC 
ATACGCGTGC ACCACGCGCG GGAGAACCAG GGTTTCGGTG CCTCGGTAAA CGAAGCAATC 
AGTCGATCCG ATGCATGCTA CGTGCTGGTC CTGAACTCCG ACACAGTAGT GGGCGAAGAT 
TTTTTACCGC TCTTATACGC GACACTCGTC GCCGATTCCC GGCTGGCAGT CATCATCCCC 
GCAGGGAATG ATTTTGCCGG ATATGATTTG AACCGGTATG TGCGGCAGCC GGGCGGCTAT 
GTTCAGACAC ACCGCCTTCG GGGTCACGCG TTTCTCATCC GCCGGGAGGT ATTCCGGGAT 
GCGAACGGTT TCGATCTGGC CTTCGGCCGC GGCTACTATG AAGATGTCGA TCTCGGGCGC 
CGCCTCAACA AACGTGGTTG GCGGGTGGGC GTGCATCCGG ATGCTCACAT ACAACATGAG 
GGGGGCGGCT CGTTCGGGCG GGGCCGCTCC TTCAAGAAAC TGGTCAGGCG CAATCGTAAG 
CTTTTTTTTT CGCGCCATCC CAGCGCAAAG CGTAATATTC TCCTTCTTTC CGGAGACTGC 
CCCCTAGCGT ATTTTCCATC GAGCCTGCTA GAGGCGCTCG ACGAGGTATT TTGCGGAGGA 
GGATACGTTT ACTGGCTTTC GCCCGAAGCG GCAGGCATGC TTCTCTGTTT GCAGATGAGG 
AGCCTCTTGT CAGGCGTGGA CGCTGCCGTG CGGTTATTCT TGTGCAGTTG GCGTGAGGAC 
AAGCGCATTT CGGAAATCTG GATATTGCCC GATGTTCCAC GCGTGCGGTA TGAGGCACTG 
ACCTTATGGG CGCGTATTTG CGGCTTGCGG ATACTGACCT GGGAAAGGGT GCCGACCGAA 
GAAAATTGTA CTCCTAGGCT ACTATGA

Protein sequence

MPAMPPIDVV IPVYNAPALT RRCIDSVVAC LSPSIRFIFI QDDASGMETH AMLDQLPRGR 
IRVHHARENQ GFGASVNEAI SRSDACYVLV LNSDTVVGED FLPLLYATLV ADSRLAVIIP 
AGNDFAGYDL NRYVRQPGGY VQTHRLRGHA FLIRREVFRD ANGFDLAFGR GYYEDVDLGR 
RLNKRGWRVG VHPDAHIQHE GGGSFGRGRS FKKLVRRNRK LFFSRHPSAK RNILLLSGDC 
PLAYFPSSLL EALDEVFCGG GYVYWLSPEA AGMLLCLQMR SLLSGVDAAV RLFLCSWRED 
KRISEIWILP DVPRVRYEAL TLWARICGLR ILTWERVPTE ENCTPRLL