Gene Nmul_A1797 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1797
Symbol
ID	3786348
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2052858
End bp	2054714
Gene Length	1857 bp
Protein Length	618 aa
Translation table	11
GC content	56%
IMG OID	637811883
Product	surface antigen (D15)
Protein accession	YP_412486
Protein GI	82702920
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0729] Outer membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAGCC TGCCTTTCAT TCGCGGGCTT CCAGTATTGT TTATACAGCC CTTCTTGCAT 
TTGCCCGTCT TGAAATTCTT GTTTTCTCTT CTGGCGGATA AAGCGTGTCT TTATCTCGGG 
GTGATCATTT TGCTCATGCT GAGTAACGAC ACGGTCGAAG CGGGTCTCTT CGGCGGCCTC 
TTCGGAGACG ATGCTCCTCC CCCCTCCATC AGCCTTTCCG CTCCGGAGCC CGTGGCGGAT 
CTGCTGAAAA CACATTTCCG TCTGCCGACA GAAGCTCTGG AAGATGAAAC TGCGCGCGCT 
ACTTTCATGC GGCGCGCCCA GCGCGAAATT AGCGAACTGC TCGCCACCGA GGGTTATTTC 
ATGCCCAGGA TAACATTGCA TCTCTCCACC CCCGGCGAGG TACCGCAACT GGAAGTCGCG 
CCGGGACCGC GGACAATGGT TGTCGGGGTG CATATCGAGT TCAAGGGAGA CCTGAGTGTT 
GATGAGCCTG GACGGCGCGC ACGGATTGAA AAGCTGCGCT CTGCCTGGTC CCTCAAGGAA 
GGCCAGCCCT TTCGCTCCCC TGCCTGGGAA GAGGCCAAAT CGGTATTGCT ATCCAATGTC 
GCGGGAGAGG ATTATGTCGC AGCGCAGATC GAGGAAAGCA GGGCGGAGAT AGATCCCGAT 
TCTTCGCAGG CGCGGTTGAG GGTGATAGTG AACTCCGGGC CGGCATTCCA CTTTGGCGAG 
CTCGACATAA AAGGGCTCAA TCGCTACGAA CCCTCACTCA TAAGCGGCCT TGCGCCATTT 
AAACCGGGGG ACCTTTATCG CCGTGATCAA TTACTCTCGT TCCAGACGAA ATTGCAGAAT 
CTGCCTCAAT TCAGTTCTGC GGCTGTCAAT ATTCAACCTG ACGAAGTAAC GCATCAGGCG 
GCGCCGGTAG AGGTAGTGCT ATCGGAGGCG AAGTCGAAGA GGGTAGGGTT CGGCGCAGGG 
TACAGTTCCA ATACGGGTGC GCGTGGCGAG GTCACTTACA TGAATAACGA TTTCCTGAAT 
AACGCCTTGA GACTGAACAG TGGATTGCGT ATCGAGCAGA AACGCCAGAG CTTGACGGGC 
TCAATCGACA GCGTGGCGGA TGCCTCGGGA ACATGGTTTT CCTTGGGGGC GGCAGCGGAT 
AGAACCTTTA TCCAGCAACT GGAAACCATA CGCCAGAAAG TCGGCGTCAG TCGCAACCAG 
CTCTTGGACA AGACCGAAAC AAGACTATCA TTGAACTGGC AGCGGGAAAA CCGGGATCCA 
AAAGGGGGCC TGGAGCAGAT CAACCAGACC TTGGTGCTGG ACGGTTATCT ACGCTATCGT 
TCCGTGGACA ACCCGTTATT CCCCAGGGAT GGCAGCGTTT CCGAATTGCG CATCGGTGGC 
GGCAAGCGGG AACTGTTGTC CGATCAGGAC TTCTTGCGGA CTTATGCCAG GCATCAGTTC 
TGGTATCCGG TGGGCAAGCG CGACGTGCTA TTTCTGAGGG GCGAGCTGGG GTACACCTTT 
GCTCCCTCGC GCTTCGGCAT TCCCCAGGAA TATCTCTTTA GAGCGGGCGG TATTCAATCC 
GTTCGCGGAT ACGCTTTTCA GCGTTTAGGC GTGAGGGAAG GCAGCGCGGT GGTCGGGGGC 
AGGGTAATGT TCACGGGTTC AATTGAATAT AATCACTGGC TTACACGTAA TTGGGGTGCT 
GCCATCTTTA CCGATGTGGG GGATGCGGCC GATACCATAG GCGGGTTGAA CCCGGCTGTC 
GGATACGGGG GAGGGATACG CTGGCGCAGT CCTGTAGGGC CATTGGCGGT GGATGTCGCC 
CGCGGGCAGC GGGACGGGAA ATTCCGTTTT CATTTTTCGA TTGCCGTGGC GTTCTGA

Protein sequence

MQSLPFIRGL PVLFIQPFLH LPVLKFLFSL LADKACLYLG VIILLMLSND TVEAGLFGGL 
FGDDAPPPSI SLSAPEPVAD LLKTHFRLPT EALEDETARA TFMRRAQREI SELLATEGYF 
MPRITLHLST PGEVPQLEVA PGPRTMVVGV HIEFKGDLSV DEPGRRARIE KLRSAWSLKE 
GQPFRSPAWE EAKSVLLSNV AGEDYVAAQI EESRAEIDPD SSQARLRVIV NSGPAFHFGE 
LDIKGLNRYE PSLISGLAPF KPGDLYRRDQ LLSFQTKLQN LPQFSSAAVN IQPDEVTHQA 
APVEVVLSEA KSKRVGFGAG YSSNTGARGE VTYMNNDFLN NALRLNSGLR IEQKRQSLTG 
SIDSVADASG TWFSLGAAAD RTFIQQLETI RQKVGVSRNQ LLDKTETRLS LNWQRENRDP 
KGGLEQINQT LVLDGYLRYR SVDNPLFPRD GSVSELRIGG GKRELLSDQD FLRTYARHQF 
WYPVGKRDVL FLRGELGYTF APSRFGIPQE YLFRAGGIQS VRGYAFQRLG VREGSAVVGG 
RVMFTGSIEY NHWLTRNWGA AIFTDVGDAA DTIGGLNPAV GYGGGIRWRS PVGPLAVDVA 
RGQRDGKFRF HFSIAVAF