Gene Nmul_A2588 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2588
Symbol
ID	3785469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2972856
End bp	2974655
Gene Length	1800 bp
Protein Length	599 aa
Translation table	11
GC content	57%
IMG OID	637812679
Product	type II secretion system protein E
Protein accession	YP_413269
Protein GI	82703703
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2804] Type II secretory pathway, ATPase PulE/Tfp pilus assembly pathway, ATPase PilB
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGCAC CTTCCGTACT CATCAGCGAG CGCAGGGAGA ATCCCGAGCA AACGGGGCAC 
CCATCTCTTG CGCTTCAGGA AGAATATTCC CGGAATGAGC TTCCGGTAGA CGCGCGGGCA 
TCACAGCCGC CGTCTCAGAT ATTGCTGCTG GATGCGCAGC GGTTGGGCGT GGCGCGCAGC 
GAGGCCGCCA ACCGGGGTGT TCCGGTGGTC AGCATCCTGG AGGAAACACT GGGATGCGCG 
CCGGAGCAGT TGATCGCAGA ACTCGGGCGG CTGCTCAGGA TGCCGGTATT GACGATGGAG 
AAGTTACGGG CATCAACTCC GGCGTTTGAA ATATTGCCTT TCAGTGAAGC CACTAAAAAG 
GAGTGCGTAT TGCTTCGCCA GCAGGGGAAG CACATCCTTG CCGTCAGCAA TCCCTTTTCC 
TCCAGCTTGA GGGCCTGGGC GGAAGAATAT ATCGATGTTC CCGCGATATG GCACCTGGTT 
CATCCCGCCG ATCTGACAGC CTTTTTCAGC CAGCAGGAGC AGACCATGCG CGCCATGGAC 
AGCGTGCTGC CTGCGGCAGA GCGGGGCGCC AGGCAGCCGG GCGAGGAAGA CCTCTCGCTG 
AAGACAATCA ACGAAGGCAC CAGCCAGGTA GTCCGTTTGG TGCATTCGAC GCTGTATGAT 
GCCCATAAGT CGCACGCGAG CGATATTCAC CTGGAAGTCG TTCCCGGAGC CCTGTCGATC 
AAATATCGTA TTGACGGTGT ACTGACCATG ATTGGAGTGG TGCAGGGGGC GGATCTGGCG 
GAACAGGTCA TTTCCCGTAT CAAGGTAATG TCCGATCTGG ATATAGCTGA GCGGCGAGTT 
CCCCAGGATG GCCGTTTCAA GATTTCCATT CAGGGGCGGG AGATCGACTT TCGTGTTTCG 
ATCATGCCCA GTGCTTTCGG AGAAGATGCG GTACTGCGCA TTCTCGACCG CCAGGCGCTG 
GCTGATCATG TCAAGGGCTT GACCCTCGAT CATCTTGGAT TCGATCGGGT CGCCATATCC 
ACCCTGCGAC GCTTGAGCTC GGAGCCCTAT GGAATGCTGC TGGTGACAGG CCCCACCGGC 
AGCGGGAAGA CTACCACGCT TTATGCGGCG ATTTCGGAAG TCAACCAGGG TCACGATAAG 
ATCATTACCA TCGAAGACCC GATCGAGTAT CAATTGCCTG GCGTATTGCA GATACCTGTC 
AACGAGAAAA AAGGATTGAC TTTCGTGCGC GGCCTTCGCT CCATCCTGCG CCACGACCCC 
GACAAGATCA TGGTAGGCGA AATCCGCGAT CCGGAAACGG CGCAGATTGC CATTCAGGCT 
GCTTTGACCG GCCATCTCGT ATTCACCACC GTACATGCCA ATAGCGTTTT TGATGTCATT 
GGCCGTTTTA CCCACATGGG AGTGGATCCC TACAGTTTCG TTTCTGCCTT GAATGGGGTT 
GCCGCGCAAA GGCTGGTGCG CCTGCTTTGC GTGCATTGCG CAGTGGAAGA ACAGCCCGAC 
GAGCAGCTGA TTGCGGAATC CGGAATCGAT CCTGAGCAGA TCGCCGCGTT CAGATTCCGC 
AGCGGCAAAG GATGCGGCCA TTGCCGGGGA AGCGGCTATC GGGGGCGAAA CGCAATCGCG 
GAAATCCTGG TGCTGAACGA TGAAATCCGC GAACTCATCG TAGCGAAAGA ACCCGTACGC 
CGTATAAAGG AAGCCGCGCG GCGGGGAGGC ACCCTGTTCC TGCGGGATGC TGCTTTGGCC 
ATGGTCAGGA GCGGGCAGAC GAGTCTACAG GAGGCAAACC GTGTCACTAT TGCGGCGTAA

Protein sequence

MNAPSVLISE RRENPEQTGH PSLALQEEYS RNELPVDARA SQPPSQILLL DAQRLGVARS 
EAANRGVPVV SILEETLGCA PEQLIAELGR LLRMPVLTME KLRASTPAFE ILPFSEATKK 
ECVLLRQQGK HILAVSNPFS SSLRAWAEEY IDVPAIWHLV HPADLTAFFS QQEQTMRAMD 
SVLPAAERGA RQPGEEDLSL KTINEGTSQV VRLVHSTLYD AHKSHASDIH LEVVPGALSI 
KYRIDGVLTM IGVVQGADLA EQVISRIKVM SDLDIAERRV PQDGRFKISI QGREIDFRVS 
IMPSAFGEDA VLRILDRQAL ADHVKGLTLD HLGFDRVAIS TLRRLSSEPY GMLLVTGPTG 
SGKTTTLYAA ISEVNQGHDK IITIEDPIEY QLPGVLQIPV NEKKGLTFVR GLRSILRHDP 
DKIMVGEIRD PETAQIAIQA ALTGHLVFTT VHANSVFDVI GRFTHMGVDP YSFVSALNGV 
AAQRLVRLLC VHCAVEEQPD EQLIAESGID PEQIAAFRFR SGKGCGHCRG SGYRGRNAIA 
EILVLNDEIR ELIVAKEPVR RIKEAARRGG TLFLRDAALA MVRSGQTSLQ EANRVTIAA