Gene Nmul_A2598 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2598
Symbol
ID	3785479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2982661
End bp	2984181
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	55%
IMG OID	637812687
Product	hypothetical protein
Protein accession	YP_413277
Protein GI	82703711
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGTGGA TTGCCCTTTA CTTTCCCGCT TTATCGCTTG ACTGGGTTGA ACGCCGGTTT 
CCGGAAGCGC TCATTCCCGC AATCGGAGTA ACTGTCCGCA AAGGGAACCA GATCTGTATT 
CAACAAGCCA ATAAGCCGGC GCAGGCGCGG GGAGTAATGG AGGGTCAGCC TCTCGCCAGT 
GCTTTGGCTG TTTTCCCGGA TCTGGTGATC ATGGAACAGG ACTCGCATGA AGAAGGAAAA 
GCCCTGCAGC AAGCCGTGTA TGCCGCATTA CGCTTTACAC CCAATATAGC GATCCAGAAC 
AGCGGCCTGA TTGCCGAGGT CTCCGGAAGC CTGAAATTGT TTGGCGGCCT GAAAAAGCTC 
TGCCAGTCGC TCAATCGGGT AGTGACTGCG CAAGGTTTGC AGCTCAGCGC AGGGATTGCG 
CCCACCGCAA CGGGAGCATG GCTGCTGGCC CGTTCCGCCT CGTCGGGCAC TGTCATCAAT 
GGGAAGGGTG AGGAGTTCCG GATATTGCTC GACGCCTTGC CTGTCGGTTT TCTGGAATCG 
GCTCAGCCTC ATCTTGAAGT CATTCGCGGG ATCGGCTGTA AAACACTGGC CGATTTGCAG 
CGATTGCCTC GCAGCGGAGT AGCGCGTCGC TTTGGTCAGA ACCTGCCGGC AGAGCTCGAT 
CGCGCCTACG GTGACGCGCC CGATCCACAA AAGTGGTTCG AGGCGCCGGA AGATTTCCAG 
CAAAAAATGA AAATGATGGG GCTGATTGAA AATGCCGGAT TGCTGCTGGT TCCTGCGCAA 
CGAATGGTCG AGCAGATGTG CGGCTGGCTG GCTTTGCGTC ATGCGGCGGT ATCCGCCTTT 
TCATTCGTGC TGCATCACGA ATATTCCCTG CGGCAACCCC ACAAATTTAC ATCCATAAAC 
ATACACCTTT CCGAGCAAAG CAGCGATCCG GCGCATTTAA TGCTGTTGCT GCGCGAGCAT 
CTGGAACGTA CAAAAATAGT GGCCCCAGTA TGTGAACTGG AACTGACGGC AGATGAAATA 
GCGGCGGGAG CAGACGGCAA TCTGGAATTG TTTCCCACCA TGCAATCCGA GACTACTTCA 
CTCAATCGCT TCATCGAGAA ATTTTCTTCC CGCCTGGGAC CGGAAGCCAT CACCGGTTTA 
AAGGTGGTTT CCGATCATCG CCCTGAATAC AGCCAAAGGT TGGAACTCTC AGGGAGGGGT 
GCCTTGAATC GCTTTTCGAA GCGAGGGAGA AACTCGCAAA TCATTCCGCC GGAATCGCCC 
CGTCCAGCCT GGCTGATGGA AATCCCGCTG GAACTGAAGG TGCAACGTGG CCGGCCGGTG 
TATGAGTCGC CACTGAAACT GCTTGCAGGG CCGGAGCGAA TCGAGGCCGG CTGGTGGAAT 
GATGACGCCA TCGCGCGGGA TTACTTCATT GCGGAGAACG ACCAGGGCCA ATTGTTATGG 
ATTTACCGCG AACACAATCC GGTAGAAAAA GATAAGGGAA ACAAAGACGG AAACTGGTAT 
TTGCAAGGAT TGTTTGGATA G

Protein sequence

MLWIALYFPA LSLDWVERRF PEALIPAIGV TVRKGNQICI QQANKPAQAR GVMEGQPLAS 
ALAVFPDLVI MEQDSHEEGK ALQQAVYAAL RFTPNIAIQN SGLIAEVSGS LKLFGGLKKL 
CQSLNRVVTA QGLQLSAGIA PTATGAWLLA RSASSGTVIN GKGEEFRILL DALPVGFLES 
AQPHLEVIRG IGCKTLADLQ RLPRSGVARR FGQNLPAELD RAYGDAPDPQ KWFEAPEDFQ 
QKMKMMGLIE NAGLLLVPAQ RMVEQMCGWL ALRHAAVSAF SFVLHHEYSL RQPHKFTSIN 
IHLSEQSSDP AHLMLLLREH LERTKIVAPV CELELTADEI AAGADGNLEL FPTMQSETTS 
LNRFIEKFSS RLGPEAITGL KVVSDHRPEY SQRLELSGRG ALNRFSKRGR NSQIIPPESP 
RPAWLMEIPL ELKVQRGRPV YESPLKLLAG PERIEAGWWN DDAIARDYFI AENDQGQLLW 
IYREHNPVEK DKGNKDGNWY LQGLFG