Gene Nmul_A0417 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0417
Symbol
ID	3784167
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	463465
End bp	464769
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	56%
IMG OID	637810493
Product	hypothetical protein
Protein accession	YP_411117
Protein GI	82701551
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGCCT GGAGTCTCGA CAGAATTACG CAGGCATTGA GTGGTGCAAT GTGGACGTTT 
TCCTCTCTGC CTGAGGACAA CTCGGCCGCC ACTTTCGTCC ATCGATGTTT CCGGCGGGAA 
AGCTGGCGAG GTGCCGGGTT TCGCGAACGC ACCCTCATGT ATGCAGCCTT ACCGTTTGCG 
CCATTCGTCA CCCTGGTGTT GGCTATCGCC TTCACTGCGC TTAACGGACA GGCTATAAAG 
AAGCGGACCG GAAAAGGGAT AATCCGGCAA ATCCGGGAAC AGTTTGAGAT TGCGCTGCGA 
TACGCGATTT TGCCCCCCTG GTATTATATT TTTGAACTGC ATGACGGCGA CAAGCGGCGG 
CGCGCTTCTG AATACATCAA CCGCTTTGAA GTAAAAACCT GCCTCTACCG CATCCTCCGT 
GACTACAATG GCGGCCTTCC CATCCCTGCA GAGCGCAGTA CCTTCTGCAT CAAGGACAAA 
TTATGCTTCC TGTCACGCTG TCGCAGGTTC TCTATTGCCA CAGCTCCTGT GTTTTTGATT 
GTCTCGAAGG GGGAGATCAA AGCAATTGAT TGGGGCGGGT CCCTGCTCCC GGAAACCGAT 
CTGTTCGTGA AACCGCTCCA GGGGGAGAAC GGAAGGAACG CGGTACGATG GGATTATCTG 
GGTTCGGGGC AATATCGGCG CAACGATGGT AAACACGCCA CCGCTCAAGA GGTGCTGGAG 
GGGTTATGCA AGGCATCATG GCGCAGGTCT TTCCTGGTGC AGCCCCGGCT TATTAACCAT 
AGAGAAATTG CCGATCTTGC AAATGGCACC TTGGCGACGA TACGGGTAAT GAGTTGCCGC 
AATGAGCGGG GCGAATTCGA GGCAACCAAT GCGGTTTTTC GAATGGCGCA AAATGAGACC 
GTAGTTGTCG ATAACTTTCA CAGAGGCGGA ATCGCAGTCA ATGTCGATCT TCATACCGGC 
AAATTGGGAA GGGGCGCCTG CGGAGCGTGG GGATCCACAG GAGGAGGATG GTACGAGCGA 
CATGACAAGA CGGGTGTGCA GATTCTGCAC CGCGAGCTTC CGTGCTGGCC CGAGTTGCTC 
GCGATGGTTC GATACGCCCA TGGGAGCGCC TTCTCCGACC AGGTGGTAAT CGGCTGGGAT 
GTTGCCCTGC TCGACAGCGG GCCGTGCATG GTTGGAATCA ACAAGGCCCC CGATCTGGAC 
ATGATCCAGC GGATAAGCCG GCGTCCGCTG GGTAACGAGC GGTTCGGAAA GCTTCTGGCA 
TTCAACCTGG AACGCACTGT CGAGGCTGTG CATCAATCTT CTTAA

Protein sequence

MSAWSLDRIT QALSGAMWTF SSLPEDNSAA TFVHRCFRRE SWRGAGFRER TLMYAALPFA 
PFVTLVLAIA FTALNGQAIK KRTGKGIIRQ IREQFEIALR YAILPPWYYI FELHDGDKRR 
RASEYINRFE VKTCLYRILR DYNGGLPIPA ERSTFCIKDK LCFLSRCRRF SIATAPVFLI 
VSKGEIKAID WGGSLLPETD LFVKPLQGEN GRNAVRWDYL GSGQYRRNDG KHATAQEVLE 
GLCKASWRRS FLVQPRLINH REIADLANGT LATIRVMSCR NERGEFEATN AVFRMAQNET 
VVVDNFHRGG IAVNVDLHTG KLGRGACGAW GSTGGGWYER HDKTGVQILH RELPCWPELL 
AMVRYAHGSA FSDQVVIGWD VALLDSGPCM VGINKAPDLD MIQRISRRPL GNERFGKLLA 
FNLERTVEAV HQSS