Gene Nmul_A0680 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0680
Symbol
ID	3784057
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	779609
End bp	780658
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	55%
IMG OID	637810762
Product	UTP-glucose-1-phosphate uridylyltransferase
Protein accession	YP_411379
Protein GI	82701813
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1210] UDP-glucose pyrophosphorylase
TIGRFAM ID	[TIGR01099] UTP-glucose-1-phosphate uridylyltransferase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCATTA CCGCCACGCC TGTAATGAAC CGGAAAGATG TACTTTCGTT GACTGCTGGA 
CCCGCTGTTC GCAAATCCCC GCGAGCGGTC CGCAAGGCTG TGTTTCCCGT AGCCGGACTT 
GGCACCCGTT TCCTGCCCGC GACCAAGGCA GTGGCCAAAG AAATGCTGCC CATTGTGGAC 
AAGCCGTTGA TCCAGTATGC GGTGGAAGAA GCGGCTGCGG CAGGTATCGA AGAAATCATT 
TTCATTACCC ATCGGAGCAA GCGCGCCATT GAAGACCATC TGCACCGGGC TGTGGAACTG 
GAAAGTGAAT TAGCCTCGCA GGGAAAACAC GCTTCCCTGA AAATGCTGCG CCAGTTGACG 
CCGGGTGGCC TTCATTTCAG CTTTGTCCGG CAGGAGGAGC CGCGGGGTTT GGGGCATGCA 
ATTTACTGCG CGCGACATCT CGTGGGCAAC GAACCGTTCG CCGTACTGCT TCCGGACGAT 
TTGATCGATG GAGATCCTCC TGTGCTGGCA CAGATGGTGT CCCAGTATGA ACAAGTCCAA 
AGCAGCCTCA TAGCGGTGCG CGAGGTTACG CGCGAACAGA CGCGGCGGTA TGGAATTGTG 
GATGCTTTTG ATGCAGAGGC AGAGAGCGAT ACGCTGAAAA TCAGGGGGGT AGTGGAAAAA 
CCTTCTCCTG ACGCTGCGCC ATCCACGATG GCTATCGTAG GTCGTTACGT TCTGTCACCC 
GCCATTTTTG ACTGCATCAG CAATCTCAAC CCGGGAACAG GAGGGGAAAT TCAGCTTACC 
GACGGAATCT CCCGTCTTCT CAAGCTGGAA TCTGTCCTGG CCTACCGTTA CCAGGGGAAG 
CATTATGATT GCGGCAGCAA GGCGGGCTTC CTGGAGGCAA CCATCGCCTA TGGTTTGCAG 
CACCCGGAAG TGGCGATGGA GTTCAGGGAA ACCTTATTAA AGATAGGACA GGAACTTATT 
CGCCAGGAGC TCATTCAGGA GTTTCAACAG GATCCGGAAC CTGTCGCCGC TGTTGCAAAC 
GAGCCCATAT TGAAGGCGGC TCAGGCATGA

Protein sequence

MSITATPVMN RKDVLSLTAG PAVRKSPRAV RKAVFPVAGL GTRFLPATKA VAKEMLPIVD 
KPLIQYAVEE AAAAGIEEII FITHRSKRAI EDHLHRAVEL ESELASQGKH ASLKMLRQLT 
PGGLHFSFVR QEEPRGLGHA IYCARHLVGN EPFAVLLPDD LIDGDPPVLA QMVSQYEQVQ 
SSLIAVREVT REQTRRYGIV DAFDAEAESD TLKIRGVVEK PSPDAAPSTM AIVGRYVLSP 
AIFDCISNLN PGTGGEIQLT DGISRLLKLE SVLAYRYQGK HYDCGSKAGF LEATIAYGLQ 
HPEVAMEFRE TLLKIGQELI RQELIQEFQQ DPEPVAAVAN EPILKAAQA