Gene Nmul_A0956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0956
Symbol
ID	3785747
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1108095
End bp	1109777
Gene Length	1683 bp
Protein Length	560 aa
Translation table	11
GC content	58%
IMG OID	637811039
Product	hypothetical protein
Protein accession	YP_411651
Protein GI	82702085
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCAGT CTCCCGATAA AAGCGCGGTG GCCGCAACCG CGCGGCCAGC CATGGGTTTC 
CTCGCTACTG CCGGCAGCTG GCTGGACGAG AATATTTTCG CGCTAGGCCG TGAAATGCGG 
TTGTCCTATC TGCCTCCACT CATGGTGTAC GTAGCTGCCG GCATTTCCGG GCTGACGGCA 
ATCGTCGGCA CGTTTTACGT CAAGGAGCGG TTAGGGCTTT CGGCCGAATT TCTTGCGGCG 
CTCGGGTTCT GGATGATGCT GCCATGGGCG TTGAAGATGC CGCTCGGGCA CCTCGTCGAC 
CTCGTGTGGC GGTGGAAGAG CCTGCTGGTG TATCTGGGCG CCGGCTTGAT CACATTGAGC 
CTGGTCATCA TGATCGGGCT GCTCGGACAC CTGGAGGAAA TGCGCGCCAT TGCTACTGTG 
GAGGCGTGGT ACGTTACTGC GGCATTGCTC GCGCCTATTG GCTACGTCCT TCAGGATGTG 
GTGGCGGATG CGATGACGGT TGAAGCCGTG CCTCGAGTCG ACAAGGACGG AAACCCGCTG 
ACGCTTGAAA GCCGCAAATC CATGCATGTC ACGATGCAGA CGCTGGGGCG GGTCGCCATC 
ATCAGCGGCG GAATTCTGGT CTCGATGGTG AATGTTTATG TGTTGCAAGG CGTGGGTGAG 
TTACCCGAGG CGGGCAAGGC CGCGGCGTAC CTGTTCGTCT ATGAGCTTGC CTTGATCATC 
CCGCTGGTTT CCGTTACCGG TGTTCTGTTC GCCTCATGGT TGAGGCGGCG AGATATTAAG 
CATCTTGTGG CGCAGGGACA TAGCCGGATG GAATCCGAAG CGCTGCTTGG GGTTAACCCC 
GATCCTCCTC CGGTGAACTG GTGGATACTT GGCGGCGGAT TGGCTTTCAC GGCAGTCTCC 
CTGAGTGTAG GCCTGAGCCA GATACCCGGG GGAGAGGAAA TCATCTTCCT GGTTTCCATG 
GCCATCGTCT TATTCCTGAT GTGGCGGCTG ACTGGCGAAC TGGAACCCGA CGCGCGCAAT 
GTGCTGGTGG GCACGGCAAT CCTGATATTC GTGTTCCGCG CCATACCCGG GCCGGGGGCT 
GGTTCGACCT GGTGGATGAT CGATCACCTT GGCTTCGATC AGCAGTTTCT GGCGACATTA 
TCCCTGATCG GCGCGACCTT GACCCTGGCG GGAATGTTCA TCTTTCGGCG ATTCATGGCT 
GAACGTTCGA TTGCCTATAT TATCGGTTGG CTTACCATCG TCGGCACCTT CTTGTCCCTC 
CCCATAATCG GGATGTATTA CGGTTTGCAC GAATGGACGG CTGCCTTAAC GAACGGCATG 
GTGGATGCGC GCTTTATCGC AGTGATCGAT ACGGCGCTGG AATCCCCCCT GGGTCAGATT 
GCAATGATCC CGATGCTTGC GTGGATTGCC AACTCCGCAC CGGAAGCGCT CAAGGCCACC 
TTCTTCGCCG TAATGGCCTC GTTCACCAAC CTTGCCCTGT CTGCGTCGCA GCTCGGGACA 
AAGTACATGA ACCAGATTTT CAGGGTAACA CGCGAAGTGA CGGACCCCGA TACCGGGAAG 
ATTACTGTTC CTGCCGACTA CAGCGAACTT GGTCCACTGC TGGTTTCAGT GACCGTGATT 
GGCCTCGTAT TGCCGCTGCT GGCTATCTTC CTGCTCAGGT ATTCACGCTT CCGCAATGCG 
TGA

Protein sequence

MSQSPDKSAV AATARPAMGF LATAGSWLDE NIFALGREMR LSYLPPLMVY VAAGISGLTA 
IVGTFYVKER LGLSAEFLAA LGFWMMLPWA LKMPLGHLVD LVWRWKSLLV YLGAGLITLS 
LVIMIGLLGH LEEMRAIATV EAWYVTAALL APIGYVLQDV VADAMTVEAV PRVDKDGNPL 
TLESRKSMHV TMQTLGRVAI ISGGILVSMV NVYVLQGVGE LPEAGKAAAY LFVYELALII 
PLVSVTGVLF ASWLRRRDIK HLVAQGHSRM ESEALLGVNP DPPPVNWWIL GGGLAFTAVS 
LSVGLSQIPG GEEIIFLVSM AIVLFLMWRL TGELEPDARN VLVGTAILIF VFRAIPGPGA 
GSTWWMIDHL GFDQQFLATL SLIGATLTLA GMFIFRRFMA ERSIAYIIGW LTIVGTFLSL 
PIIGMYYGLH EWTAALTNGM VDARFIAVID TALESPLGQI AMIPMLAWIA NSAPEALKAT 
FFAVMASFTN LALSASQLGT KYMNQIFRVT REVTDPDTGK ITVPADYSEL GPLLVSVTVI 
GLVLPLLAIF LLRYSRFRNA