Gene Nmul_A1422 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1422
Symbol
ID	3786620
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1633332
End bp	1634411
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	55%
IMG OID	637811510
Product	secretion protein HlyD
Protein accession	YP_412117
Protein GI	82702551
COG category	[V] Defense mechanisms
COG ID	[COG1566] Multidrug resistance efflux pump
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0497268
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGCCAT CCGTCTCAAA TAAAGCAGCG CAACCGCATC TGACATCATC GGTGAATAAA 
AAACTCGTCC TTATAGGAAT AGCAATAGGA CTTGCTCTGA TTTCGGTGGG AACGGTAAGC 
TGGTTTTTTA CCCATAAGAA AAGCAATGGC GAGTTCCTGA CTCTCTTTGG CAATGTGGAT 
ATCCGCCAGG TTTCTCTCGC CTTCAACGGA AACGATCGGA TCGCTGAAAT GCGAGTGGAG 
GAAGGAGACC GGGTCAGGGC CGGACAAGTT CTGGCAAAGC TGGATACCCG CATTCTCACG 
TTGCAAATTG CGCAAGCCGA AGCCCAGGTT GCCGCCCAGG AGCAAGCTCT GTTACGGCTT 
GAGAACGGTA CCCGTCCCGA GGAAATAGCA CAGGCCAAAG CCGAAGTTGC TTCCGCTCAG 
GCCGATGCCG ATCTCGCCCG GCAGTTTCTC GGCCGCTTGA TGGAGATTGA AAGTGACTCG 
GGGGCGGCCG TCAGCCAGCA GGATCTCGAC AATGCCAGGT CTCGCCGTCG GGTGGCCGTA 
GCGCAACTCG AAAATCGTAA AAAGGCACTG CAACTGGCAT TGATCGGGCC GCGCAAGGAA 
GATATTGCGC AGGCGGAGGC GCAGTTGAAC GTTTTTCGTG CTGAGCTGGC CTTGCTGCGG 
CACCAGCTTG ATTTGGCCGA ATTGAAATCC CCTATTGATG CTGTCATACG CTCACGTCTT 
CTCGAACCGG GAGACATGGC TTCGCCACAA CGTCCGGTTT ATGCGCTGGC CATAACCGAT 
CCAAAATGGG TCCGAGCCTA CGTATCCGAG ATCGATCTAG GCCGAATCAA GCTTGGCATG 
AGGGCAGAGG TTGTTACCGA CAGTCATCCG GAGGAGTCCA TTCATGGTCG TATTGGCTAT 
ATCTCGTCGG CTGCCGAGTT CACCCCAAAG CCTGTACAAA CCGAGGAGCT GCGCACCAGC 
CTTGTCTATG AGATACGGGT GTATGTGGAA GACGCGGAGG ACAGGCTGCG TCTGGGTATG 
CCCGCCACCG TGCATATCGC TCTCAGAAAT AATGGAAATT CCAGCGAAGT GAAGCATTGA

Protein sequence

MRPSVSNKAA QPHLTSSVNK KLVLIGIAIG LALISVGTVS WFFTHKKSNG EFLTLFGNVD 
IRQVSLAFNG NDRIAEMRVE EGDRVRAGQV LAKLDTRILT LQIAQAEAQV AAQEQALLRL 
ENGTRPEEIA QAKAEVASAQ ADADLARQFL GRLMEIESDS GAAVSQQDLD NARSRRRVAV 
AQLENRKKAL QLALIGPRKE DIAQAEAQLN VFRAELALLR HQLDLAELKS PIDAVIRSRL 
LEPGDMASPQ RPVYALAITD PKWVRAYVSE IDLGRIKLGM RAEVVTDSHP EESIHGRIGY 
ISSAAEFTPK PVQTEELRTS LVYEIRVYVE DAEDRLRLGM PATVHIALRN NGNSSEVKH