Gene Nmul_A1420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1420
Symbol
ID	3786618
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1630361
End bp	1631524
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	53%
IMG OID	637811508
Product	hypothetical protein
Protein accession	YP_412115
Protein GI	82702549
COG category	[V] Defense mechanisms
COG ID	[COG0842] ABC-type multidrug transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGGGAA AAAACAGCCA ATCAGGTCAA CGGAATTATC TCGGCTTTCA ACTACGTCTC 
ATTTCCCTGA TTCGAAAGGA AATACGCCAA CTGTTGCGAG ACAAAAGCAA TCTCGCGGTT 
GGAATTGGTC TCCCCATTAT ATTGATCCTC ATTTTCGGTT ACGGCTTGTC CCTCGATGTC 
AGGAATGCGC CCGTTGCAAT CGTACTGGAA GATGCCTCCC CCACTGCGGT GGACGTTGTC 
TCAGGCCTGG AACTTTCTCC GTATATTTCA CCTGTAAGAG TTCCATCCAT GCAGGAGGCA 
GAGCGTTTGA TGCTGGCGCG AGAAATAGAG GGGATCTTCC GGATACCAAG CGATTTTTCC 
CGACGATTGG GAGAAGGCGA AGCACAAGTC CAGTTTCTGG CCTATGGAAC AGATTCCACT 
CGCGCAACAA TCATTCGAAG CTACATCAAC AGTATTGTTG GCCAGTGGAC GTTGCGGCAG 
GCTGACCGAA AAGCGGCTTC ATCGGTCCCG GCCGAGGGTA GAATCACGCT GGTGGAACGC 
TTGTGGTTCA ACTCCGCCAA CTCCAGTACA TGGTATCTGG TGCCAGGCTT GATCGTTCTG 
ATCATGACCC TCATCGGGGC CTTTCTCACC GCGATGGTGA TGGCGCGCGA GTGGGAACGC 
GGTACGCTGG AAGCATTGTT CGTCTCGCCC GTGCGCCCCA CGGAAATCCT GCTGGCGAAA 
ATTGTCCCCT ATTTTCTGGT TGGCATGGCG GGTCTCGGGT TATGCCTGGC CGCAGCGCAT 
TTTCTGTTCG AGGTGCCCAT GCGCGGCTCC CTGCTAATCC TGCTGGGCGG CTCGATGCTC 
TATCTATTGG TGGCGCTGGG TTTCGGCCTG GTCATCTCGT CCATTACCAA AAACCAGTTC 
ACTGCCAGTC AAATCGCAAT TATTACCAGC TTCATGCCCG CCCTCATGCT TTCCGGCTTT 
CTTTTTGACT TGCGCAACGT GCCTGTTGTC ATTCAGCTGG TTGGAAAGAT TCTACCGGCC 
ACTTATTTCA TGGAATTGAT CCGGACGCTG TATCTCGCCG GCAATGTATG GCCGGTGATA 
ATAGAGAATT ATGCGATTCT CACAAGCTAT GCAGTGCTGT TGCTGGGTCT TGCGCGCTTC 
GTCACCCGCA AGAAACTGGA TTGA

Protein sequence

MRGKNSQSGQ RNYLGFQLRL ISLIRKEIRQ LLRDKSNLAV GIGLPIILIL IFGYGLSLDV 
RNAPVAIVLE DASPTAVDVV SGLELSPYIS PVRVPSMQEA ERLMLAREIE GIFRIPSDFS 
RRLGEGEAQV QFLAYGTDST RATIIRSYIN SIVGQWTLRQ ADRKAASSVP AEGRITLVER 
LWFNSANSST WYLVPGLIVL IMTLIGAFLT AMVMAREWER GTLEALFVSP VRPTEILLAK 
IVPYFLVGMA GLGLCLAAAH FLFEVPMRGS LLILLGGSML YLLVALGFGL VISSITKNQF 
TASQIAIITS FMPALMLSGF LFDLRNVPVV IQLVGKILPA TYFMELIRTL YLAGNVWPVI 
IENYAILTSY AVLLLGLARF VTRKKLD