Gene Nmul_A1036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1036
Symbol
ID	3785163
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1197645
End bp	1199180
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	57%
IMG OID	637811120
Product	integral membrane protein MviN
Protein accession	YP_411731
Protein GI	82702165
COG category	[R] General function prediction only
COG ID	[COG0728] Uncharacterized membrane protein, putative virulence factor
TIGRFAM ID	[TIGR01695] integral membrane protein MviN

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCTGC TCAAAGCCCT TGTCACCGTC AGCGGGATGA CGTTCATATC CCGCATTCTG 
GGATTTGCGC GGGATGTCAT CATTGCCCGC ATTTTTGGCG CAGGCGTCGA AACCGATGCT 
TTCTTTGTGG CATTCCGTAT CCCCAACCTG TTGCGCCGGC TGTTCGCCGA GGGGGCGTTT 
TCTCAGGCGT TCGTGCCCAT ACTTGCCGAA TACAAGAATC GCCGCACAGC CGAAGATACG 
CGCGAGCTGG TAAGTCATGT CGCAACGCTG CTGTTCATCG CGCTATTTGC GGTCACGCTG 
GCAGGCGTTA TTGCGGCACC GCTGGTCATC TATGTAAGTG CGCCAGGATT CACGGCAAGC 
CCCGGGAAAT TCGAGCTTAC GGTGGAACTG CTGCAGATCA CGTTTCCCTA CATCCTGTTC 
ATCTCGCTCG TGTCGCTGGC TGGCGGCATC CTCAACACCT GGAGCAGATT TTCAGTGCCT 
GCCCTGACTC CGGCCCTGCT CAACCTGTCG TTTATCGGCT GCTCGCTATG GCTGGCACCC 
CTCATGGACC CGCCAGTGCT GGCGCTCGCG TGGGCGGTAT TCATCGGGGG GGTGCTCCAG 
CTTGCCTTCC AGGTACCGTT CCTCATGCGC CTCAAATTGA TGCCGCGCCC GCGCCTGAAA 
TCCCCCGACA ATGGTGCATG GCGTGTTCTC AAGCAAATGG GACCGGCTGT TTTCGGCATG 
TCTATCGGCC AGATCAGCCT GCTGATCAAC ACGATATTTG CTTCCTTTCT TGTCACAGGC 
AGCGTTTCCT GGCTTTATTA TGCGGATCGG CTAATGGAGT TTCCCGCCGG TCTGTTGGGT 
GTTGCGCTCG GCACGGTCCT GCTGCCGTCC TTGTCGCGGC ACTATGCCGA CAACAGCACG 
GATGAATATT CCCGGCTGCT TGACTGGGGT TTGCGCCTGA CCATGCTGCT GACGCTGCCG 
GCGGCGCTGG CGCTGGCGCT GCTTGCCACG CCGCTTATCA CGACACTGTT TCATCACGGC 
GAATTCTCGG CCAATGATGT CTGGATGACA CGCAATGCCC TCATCGCGTA CAGCGTGGGC 
CTGCTGGGGC TGATTCTGGT GAAAGTGCTG GCCCCTGGTT TCTACGCAAG ACAGAACATC 
AAGACACCGG TAAAAATAGC CCTCATCACG CTTGTCGCGA CCCAGTTGAT GAATCTCGCC 
TTCATCATAC CGCTGCGACA CGCCGGGCTC GCGCTTGCCA TCGGATTGGG CGCCTGTATC 
AATGCGGGCC TGCTCTATTA CAAATTACGG CGTCATCAGA TTTATCAGCC TCAACCAGGA 
TGGGGCATCT TTATGACAAA AATATCGGCA GCCCTGGCGA TGATGGGAAC CATATTATGG 
TTTGCTTCAG GCACCGATGT TTCGTGGCTG ACGGATACGG CGGCAGTGCG AGGGGTACGG 
TTGGCAGGAG TCGTCATGAT CGGGGCGGCG AGCTACTTTG TTACCTTATG GCTGCTCGGT 
TTTCGCCTTA AGGATTTCTC CCGGCGCGCT GCATAG

Protein sequence

MNLLKALVTV SGMTFISRIL GFARDVIIAR IFGAGVETDA FFVAFRIPNL LRRLFAEGAF 
SQAFVPILAE YKNRRTAEDT RELVSHVATL LFIALFAVTL AGVIAAPLVI YVSAPGFTAS 
PGKFELTVEL LQITFPYILF ISLVSLAGGI LNTWSRFSVP ALTPALLNLS FIGCSLWLAP 
LMDPPVLALA WAVFIGGVLQ LAFQVPFLMR LKLMPRPRLK SPDNGAWRVL KQMGPAVFGM 
SIGQISLLIN TIFASFLVTG SVSWLYYADR LMEFPAGLLG VALGTVLLPS LSRHYADNST 
DEYSRLLDWG LRLTMLLTLP AALALALLAT PLITTLFHHG EFSANDVWMT RNALIAYSVG 
LLGLILVKVL APGFYARQNI KTPVKIALIT LVATQLMNLA FIIPLRHAGL ALAIGLGACI 
NAGLLYYKLR RHQIYQPQPG WGIFMTKISA ALAMMGTILW FASGTDVSWL TDTAAVRGVR 
LAGVVMIGAA SYFVTLWLLG FRLKDFSRRA A