Gene Nmul_A0403 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0403
Symbol
ID	3785396
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	446083
End bp	447147
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	53%
IMG OID	637810479
Product	permease YjgP/YjgQ
Protein accession	YP_411103
Protein GI	82701537
COG category	[R] General function prediction only
COG ID	[COG0795] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0309466
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAATAA TTTACCGCTA CCTGGGGCTC CAGGTTTTGA TGGGTCTGGG AATCGCTACC 
GCGGTGCTTC TGCCGCTCTT CGGTTTCCTT GATTTGCTGG ATCAGCTCGA TGACGTGGGA 
AAGGGCACGT ACAGCGTCAA GGATGCGTTT CTTTATACGG CTCTACTGCT GCCGCGACGG 
TTTATTCAAC TCGCGCCTTT CATTGCATTG ATGGGCAATG TAACTGCATT GGGAAGGCTT 
GCCGTCGGAT CGGAACTGAC GGCATTACGA GGAGCAGGGG TATCTCCGCT GGGCATCAGT 
CTCGCGCCGG TTGTCGTTGG AATAATTCTT TTACTGTTTA TTACTGTACT GGATCAGTTC 
GTGGCGCCGC AATTTCAGCA GAAAGCCATT TCATCCCGCG CAGCCGCGCT CGAGAAGAGC 
GCCGCGCTTG GCCAACAATT AGGGATATGG ACGCGGGATG AGCGGAATAT ACTGCGAATC 
GGAGAAATGC TGCATGCGAG AAGGGCGGCG AACATCGAAA TAATGCATTT TGACGACAAT 
GGCTTCCTGT TACGCTATAC GTATGCCAAG TATGCTGATA TCATAAACGA GGGGTTGTGG 
GAGTTAAGGG ACGTCGTCAT CAAGACATTC AACGGCAATG CCATGGAGAT CGTAAGCAGA 
GAATCGGTAC CCTGGGAACC CTTCCTGAAG GAGGAGGATA TCTCGACGTT GACCAAATCG 
CCGGAAAGTC TCTCACCCGC CGAGTTATTT TTGCATGTGC ATTTTCTGCG CGCCACGGGT 
CAGGAATCGG GCGCTTATGA GCTGGCGTTG TGGCGCAAGG CGGGTGGTGC CCTGACGACC 
ATCGCGATGC TGTTGCTTTC GATTCCCTTT GTTTTTGGAT CGGTGCGGGC AGGGCTCGGC 
AACCGACTCG TGGTTGCATC GATGCTTGGA ATCAGCGTCT ATCTCTTCGA CCAGATCACT 
GCCAATGCCG GCTTGTTACT GCATTTGAAT CCGGCGCTGA GCGCACTTCT TCCAGGAGGG 
GTGCTGATCG CCGTAGCTTA TTTCTGGTTA CGGCGAATTT TTTAA

Protein sequence

MTIIYRYLGL QVLMGLGIAT AVLLPLFGFL DLLDQLDDVG KGTYSVKDAF LYTALLLPRR 
FIQLAPFIAL MGNVTALGRL AVGSELTALR GAGVSPLGIS LAPVVVGIIL LLFITVLDQF 
VAPQFQQKAI SSRAAALEKS AALGQQLGIW TRDERNILRI GEMLHARRAA NIEIMHFDDN 
GFLLRYTYAK YADIINEGLW ELRDVVIKTF NGNAMEIVSR ESVPWEPFLK EEDISTLTKS 
PESLSPAELF LHVHFLRATG QESGAYELAL WRKAGGALTT IAMLLLSIPF VFGSVRAGLG 
NRLVVASMLG ISVYLFDQIT ANAGLLLHLN PALSALLPGG VLIAVAYFWL RRIF