Gene Nmul_A0987 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0987
Symbol
ID	3786587
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1144740
End bp	1145816
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	55%
IMG OID	637811070
Product	hypothetical protein
Protein accession	YP_411682
Protein GI	82702116
COG category	[S] Function unknown
COG ID	[COG5563] Predicted integral membrane proteins containing uncharacterized repeats
TIGRFAM ID	[TIGR02913] probable extracellular repeat, HAF family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.779307
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACTAC TCAGCCATTC CTTCAAGGTT CGCCATCTTA TCCTGGCCGC AGCCTTAACT 
ACCGGCCTTG GTTTTGTCAA TCCTGCAAAC GCCGAAATAG TCCTCCTTGT TGACCTTAAC 
AGCAGGACAG CAATTAGTCT GGGCACTTTG GGCGGGAACT GGAGCAATGC CTACGGCATC 
AACGATGCTG GGCAGGTGGC TGGATACTCT CACACGGCTG AAGGTGGTCA GCATGCCTTC 
ATCACCGGTA CTGATGGGGT GGAGATGAGA GACTTGGGCA CCTTGCGGGG GGGTGAGAGC 
TATGCGCTCG ACATCAACGA TGCCGGACAG GTAGTGGGAG GCTCTGGCAC TGCTGGAGGC 
TATGTCCATG CTTTCATCAC TGGCCCGAAT GGCACGGGGA TGAGAGACCT GGGCACTTTA 
GGCGGGCGCT GGAGCTATGC TTTCGGCATC AACGATGCCA GACAGGTGGC TGGATACTCT 
CTCACGGCTG ATAGTAATCG TCATGCCTTC ATCACCGGTT ATGATGGCAT GGGGATGAGA 
GACCTGGGCA CTTTGGGCGG GAGCTTGAGC GAGGCTTCCG GCATCAACGA TGCCGGACAG 
GTGGTAGGAA TGTCTGGCAC AGTTGATGGT AATCTTCATG CCTTCATCAC CGGCCCTGAT 
GGGGTGGGGA TGAGAGACCT GGGCACTTTG GGGGGGCGCT GGAGCTATGC CTACGGTATC 
AACGATGCCG GACAAGTGGT TGGAAACTCT TCCACGGCTG AAGGTAGTCT CCATGCCTTT 
ATCACCGGTC CCGATGGGGT GGGGATGAGA GACCTAGGCA CTTTATTAGG TGGGAACGGA 
AGCCAGGCCA ACGGCATCAA CGACATCGGA CAGGTAGTGG GATACTCTTA CACGGCTGAA 
GGTTATTACC ATGCCTTCAT CACCGGTCCT GATGGTGAAG GAATGACGGA CCTCAATTCG 
TTGGTTGACC TCCCTCAAGG CATGGTTCTA GTCAAGGCAA TGGATATCAA TAACAGGGGT 
CAAGTCATTG CTATTGCTAT TCCTACTACT ATCCCGAACC TGAAGCCTAT GCCTTGA

Protein sequence

MTLLSHSFKV RHLILAAALT TGLGFVNPAN AEIVLLVDLN SRTAISLGTL GGNWSNAYGI 
NDAGQVAGYS HTAEGGQHAF ITGTDGVEMR DLGTLRGGES YALDINDAGQ VVGGSGTAGG 
YVHAFITGPN GTGMRDLGTL GGRWSYAFGI NDARQVAGYS LTADSNRHAF ITGYDGMGMR 
DLGTLGGSLS EASGINDAGQ VVGMSGTVDG NLHAFITGPD GVGMRDLGTL GGRWSYAYGI 
NDAGQVVGNS STAEGSLHAF ITGPDGVGMR DLGTLLGGNG SQANGINDIG QVVGYSYTAE 
GYYHAFITGP DGEGMTDLNS LVDLPQGMVL VKAMDINNRG QVIAIAIPTT IPNLKPMP