Gene Nmul_A0441 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0441
Symbol
ID	3785909
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	490275
End bp	491582
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	57%
IMG OID	637810517
Product	adenylosuccinate synthetase
Protein accession	YP_411141
Protein GI	82701575
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0104] Adenylosuccinate synthase
TIGRFAM ID	[TIGR00184] adenylosuccinate synthase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.83493
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAAAA ATGTAGTTGT CATAGGAACC CAGTGGGGTG ATGAGGGTAA GGGCAAGATC 
GTGGACTGGC TTACGGATCA GGCGCAGGGC GTGGTGCGCT TCCAGGGAGG ACACAACGCG 
GGTCATACGC TTGTCATTGG TGGCAAGCAG ACCGTGCTAC ACCTGATTCC TTCCGGAATT 
CTCCGTAAGG ATGTCGCCTG CTATATCGGT AATGGCGTCG TTGTGTCGCC ACAGGCGCTT 
CTGGATGAAG TCGGCATGCT GGAGCGCGCG GGCATCGATG TGCTCAGCCG GCTCCGTATC 
AGCGAGGCTT GTCCTCTCAT TCTACCCTGT CATGTGGCCC TGGATAACGC GCGGGAGATC 
GCCAGAGGAT TGGGTAAAAT CGGCACGACC GGGCGGGGTA TTGGGCCGGC ATATGAGGAC 
AAGGTGGCGC GGCGCGCCGT CCGTTTGCAG GACTTGTTTC ATCGTGACCG CTTCGCGGCA 
AAGCTGGGCG AGATACTGGA TTATCACAAT TTCGTGTTGA AGAACTATTT CCAATCGCCA 
GTCGTCGATT TTCAGCAAAC CATGGACGAG ACGCTCTCAC TGGTGGAACG CATCCGCCCC 
ATGGTTGCCG ATGTGCCGCG GCTTTTATTC GAAGCCAACC GGGCAGGCGC GAATCTTCTG 
TTTGAGGGGG CGCAAGGAGC ACTGCTCGAC ATTGATCACG GCACTTACCC GTTTGTTACG 
TCCAGCAATT GCATTGCCGG CGCCGCAACA ACAGGAAGTG GAATCGGCCC CCAGATGTTG 
CACTATGTGT TGGGGATCAC CAAGGCCTAT ACCACGCGCG TGGGGGCGGG GCCCTTTCCA 
ACCGAACTGG ATGATGATGT CGGCAGGCAT CTTGCCAAGC GCGGCAATGA ATTCGGGGCA 
ACCACGGGGC GTCCGCGACG CTGCGGCTGG TTCGATGCCG CCGCCCTGAA GCGCTCCATC 
CAGATCAATG GCGTCTCCGG ATTGTGTGTC ACGAAGCTCG ATGTGATGGA TGGGGTTGAA 
ACCCTGCGGC TGGGCGTGGG CTATAAAATG ATGGGAAAAG GAGAGGAAGA AAAATTTAGT 
GCCATCATGC CGGTAGGTGC AGAGGAACTT GCCTCCTGCG AACCCGTTTA CGAGGAAATG 
CCCGGATGGA GCGGAAGCAC CGTGGGTATT CGGAATTTCG AACAACTGCC CATGGCTGCG 
CGCAACTATC TCAAGCGTAT GGAAGAAGTG TGTGAGGTAT CGATAGACAT GATATCGACC 
GGACCGGATC GGGAAGAAAC GATCGTGTTG CGGCACCCTT TCGAGTAG

Protein sequence

MSKNVVVIGT QWGDEGKGKI VDWLTDQAQG VVRFQGGHNA GHTLVIGGKQ TVLHLIPSGI 
LRKDVACYIG NGVVVSPQAL LDEVGMLERA GIDVLSRLRI SEACPLILPC HVALDNAREI 
ARGLGKIGTT GRGIGPAYED KVARRAVRLQ DLFHRDRFAA KLGEILDYHN FVLKNYFQSP 
VVDFQQTMDE TLSLVERIRP MVADVPRLLF EANRAGANLL FEGAQGALLD IDHGTYPFVT 
SSNCIAGAAT TGSGIGPQML HYVLGITKAY TTRVGAGPFP TELDDDVGRH LAKRGNEFGA 
TTGRPRRCGW FDAAALKRSI QINGVSGLCV TKLDVMDGVE TLRLGVGYKM MGKGEEEKFS 
AIMPVGAEEL ASCEPVYEEM PGWSGSTVGI RNFEQLPMAA RNYLKRMEEV CEVSIDMIST 
GPDREETIVL RHPFE