Gene Nmul_A1535 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1535
Symbol
ID	3785608
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1753640
End bp	1754836
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	54%
IMG OID	637811623
Product	hypothetical protein
Protein accession	YP_412230
Protein GI	82702664
COG category	[S] Function unknown
COG ID	[COG3503] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000132608
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCAAAC CCTCTCCTGC ACCTTCCTCA ACTCCTCCAC CCTATATTAC TTCTGTCGAT 
CTCATGCGTG GGCTGGTCAT GGTTCTCATG GCCCTTGACC ATGTGCGCGG ATTCTTCACC 
AATGCCGATT TCAGCTCCAC TGATCTTGCC CGCACTACTC CCGGCGTTTT CCTGACACGC 
TGGATCACTC ACCTGTGCGC CCCCACCTTT GTGTTTCTGG CAGGCACCAG TGCTTATCTG 
TCTGCATCGC GGGGGATGGC CCACTCCCAG TTGGCGAAAC GATTATTCCT GCGGGGGTTG 
TGGCTGGTAT TTCTTGAACT GACGGTGGTG CGTTTTGCCT GGTTCTTCAA TCTGGATTAC 
AACTTGATGG ACCTGCAGGT GATCTGGGCG CTGGGGTGGT CCATGATTGT TCTCGCGGCG 
CTCGTCTATC TGCCGCTATG GGCGGTCGCC GGCGTTGGCA TCGGCATGAT CCTGACTCAC 
AATCTGCTCG ACAGCATACG GCTTGAGGAT TTTCAGGCAG CGGGCGGCTC GCTCACCTGG 
AAAGGGTGGC TGGTGAGCGT GCTCCACATC CCCCACTTTC CGGTGGTGTA CCCTCTCATC 
CCCTGGATCG GAGTAATGGC CTCGGGTTAT GCATTTGGTC CTCTCATGCT GCTGCCATCG 
AGGACAAGAA TAAAGGTAGT ATTTAAATGC GGCACGATTC TTGTCGCAGG CTTCCTCATT 
CTCCGCGGCC TGAATATTTA TGGCGATCCG GATCCATGGG TTTTGCAGGA AACCCCCGTG 
TTCACACTAC TTTCCTTCCT GAATACGACG AAATATCCAC CGTCACTGCT CTATCTGCTG 
ATGACACTCG GACTCATGTT CCTGCTGATA TCTGCATTTG AATGGTGGCA TGAGGCGCAC 
GGGCCGCACG GTGTCGCAGG ACGTTTTCTG ATTACCTTTG GCCGCGTGCC CCTGTTTTTC 
TATCTCATTC ATCTGTATTT TATTCATGGC TTCACCCTGC TCATTGCGTT TGCAATGGGA 
GCGAATATTC GCTCCTTCCT GACCTCTTCC TGGGAATTCC CATCCTGGTG GGGATTCAGC 
CTTCCAGTTG TTTACCTGGT ATGGGTGGGA GTCACTACCA CACTCTATCC CATCTGCCGC 
CGGTTCGCGG CATTAAAATC TCGCCACCGG GGCAGTTGGT GGACGCCCTA TATCTAA

Protein sequence

MAKPSPAPSS TPPPYITSVD LMRGLVMVLM ALDHVRGFFT NADFSSTDLA RTTPGVFLTR 
WITHLCAPTF VFLAGTSAYL SASRGMAHSQ LAKRLFLRGL WLVFLELTVV RFAWFFNLDY 
NLMDLQVIWA LGWSMIVLAA LVYLPLWAVA GVGIGMILTH NLLDSIRLED FQAAGGSLTW 
KGWLVSVLHI PHFPVVYPLI PWIGVMASGY AFGPLMLLPS RTRIKVVFKC GTILVAGFLI 
LRGLNIYGDP DPWVLQETPV FTLLSFLNTT KYPPSLLYLL MTLGLMFLLI SAFEWWHEAH 
GPHGVAGRFL ITFGRVPLFF YLIHLYFIHG FTLLIAFAMG ANIRSFLTSS WEFPSWWGFS 
LPVVYLVWVG VTTTLYPICR RFAALKSRHR GSWWTPYI