Gene Nmul_A1766 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1766
Symbol
ID	3783966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2018737
End bp	2019891
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	55%
IMG OID	637811852
Product	hypothetical protein
Protein accession	YP_412455
Protein GI	82702889
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00135853
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCCTCG GAAATCTCCC AAAAGAAAAT CCGGGTGTAG TCTCCCCATC CAACTTCATC 
GGATTCGGTC TCCGCTCCAG CCTTCAAATG AAGCATAATA TTCTCGCTCG CCACCCCAGC 
GATTTGAATA TCGGCTGGGC GCAACGGGTA GTCAATTGTC ATTGTTCCCA TGTAACGGTA 
TCCAGGGTAG ATCTGGTTTC CGTCGATATA GGAACGACGA CACGGGTTCG GATTGCGGTT 
GAACATGATG GTCCGGAGAC GATCTCGCGC AAGTGGTTTG TAAAATTACC TTCGCTGGCC 
TGGCGGCCAA GGCTGATTAC TGGGTTGCCA GGATTACTTC ATACTGAAAC CCGCTTCTAC 
AATGAAACAG CGCAAGCGGT GCCCATCGCC GTACCCGGTT TTCTCGCGGG TCAGAGTAAA 
CCCGGCAAGG GTGCGACGCT GGTTTTGAAT GATGTGACTG AATCCGGGGC TGCTGCCGGC 
AACCCTGGGG ATGCCCTGAC GGCGGATCGC GCCGCACTTG TCATCAAACA ACTGGCCCGG 
CTGCATGCCC GCTTCTGGAA CAAATTCGAT CTTATGCAGA AATATGCCTG GCTGGCGGGC 
ATACGCCAAC TCGAAGATCA CCTGGGGACT GCGCTTGCCG TTCCGCTGAT GAAGCGGGGG 
CTCCGGCAGG CGGAAAAACT CATACCCTTC CCGCTGCATG CACCCGCTAT AAATTATGCT 
CGCCAGCGTC GGCGCGCCAT GCGCTTTCTT TCAGGGCGAC CGCAAACACT CGTTCATCAT 
GATTGTCATC CCGGCAACCT GTTCTGGAGC CAAACTCAAC CGGGTCTTCT CGACTGGCAA 
TTGGTGCGTT TCGGCGAAGG GATTGGTGAT GTCGCTTATT TTCTTGCTAC CGCCCTAACG 
CCCGAGGTAC GGCGAAATCA TGAGGCAAAT CTGCTGGCTA TCTATGCCCA AGAGCTCACG 
AACTGTGGTA TCGAAAACAT TGACGGCGAG ATATTGAAGC AGAGATACCG TGCTCACCTC 
GTTTATCCAT TCGAAGCAAT GGTTGTGTCG CTCGCTGTCG GCGGAATGAT AAAGCCGGAA 
ACCAACCGGG AACTGATTCG CCGCGTCGCC ACCGCTGTGA ACGACCTCGA TGCTTTTGCG 
GCAATCCCGC TATAA

Protein sequence

MRLGNLPKEN PGVVSPSNFI GFGLRSSLQM KHNILARHPS DLNIGWAQRV VNCHCSHVTV 
SRVDLVSVDI GTTTRVRIAV EHDGPETISR KWFVKLPSLA WRPRLITGLP GLLHTETRFY 
NETAQAVPIA VPGFLAGQSK PGKGATLVLN DVTESGAAAG NPGDALTADR AALVIKQLAR 
LHARFWNKFD LMQKYAWLAG IRQLEDHLGT ALAVPLMKRG LRQAEKLIPF PLHAPAINYA 
RQRRRAMRFL SGRPQTLVHH DCHPGNLFWS QTQPGLLDWQ LVRFGEGIGD VAYFLATALT 
PEVRRNHEAN LLAIYAQELT NCGIENIDGE ILKQRYRAHL VYPFEAMVVS LAVGGMIKPE 
TNRELIRRVA TAVNDLDAFA AIPL