Gene Nmul_A2354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2354
Symbol
ID	3785291
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2680898
End bp	2682256
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	62%
IMG OID	637812445
Product	type II secretion system protein E
Protein accession	YP_413037
Protein GI	82703471
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4962] Flp pilus assembly protein, ATPase CpaF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGATAC GAGAACGTCT CCAGAGCGTG AAGGAAACCG GGTTGGCTGA GCATCATCCC 
GCGCCGGTCA CGGCCCTGCA CGATATCCCC GCCTATGAGG AATTGAAGGC CCGCGTCCAC 
CAGAAGCTGC TCGATCGGGT GGATCTGGCA GTCATGGAAA GCCTGCCGGC TGAACGCCTG 
CTGATGGAGA TCAGGAACCT GGTGGAGCGG TTGCTGGTCG AGGAATCCGT CCCCATCAAC 
GAGGCGGAGC GGCAGGGCAT CGTCCGCGAC ATCCAGAACG AAGTGCTCGG CCTGGGTCCG 
CTCGAGCCCT TGCTGGCAGA CCCGACCATT TCCGACATCC TGGTGAATAC CCATCGGCAG 
GTCTATGTCG AGCGGCGGGG ACGTCTGGAA CTGACCGACA CCCACTTTGC CAACGAAAAG 
CACTTGCGAA AGATCATTGA CAGGATCGTG TCGCGTGTCG GGCGGCGCGT GGATGAGTCC 
AGTCCCATGG TCGATGCGCG TCTGCCCGAC GGTTCACGCG TCAATGCCAT CATTCCGCCC 
CTGGCGATCG ATGGCTCGCT GCTTTCGATC CGGCGTTTTT CCGTCAAGCC GCTCAAGATG 
AACGATCTCA TGGCGTACAA GTCGCTGACC CCGGAAATGG GCGAGATCAT CAGCGGACTG 
GTCAAGGGCA AGTGCAGCAT ACTCATTTCC GGCGGCACCG GCAGCGGCAA GACCACGCTG 
CTCAATATCA TGTCCGGTTT CATTCCGTCC TCCGAACGGA TCGTGACCAT CGAGGACGCG 
GCCGAGCTGC AGCTGCAGCA GCCCCACGTG GTGCGGCTGG AGACGCGCCC GCCCAACGTC 
GAGGGCAAGG GGGAAATCTC GCAACGGGCG CTGGTGAAGA ACAGCCTGCG CATGCGCCCC 
GACCGGGTGA TCATAGGGGA AGTGCGCGGA GCCGAGGCGC TGGATATGCT GCAGGCCATG 
AACACCGGTC ACGAAGGTTC CATGGCCACG ATCCATGCGA ATACGCCGAG GGATGCCCTG 
GGCAGGGTTG AAAACATGGT GAACATGGCC GGGTTGAACC TGCCCATCAA GGCGGTCCGC 
CACCAGATCA GTTCGGCCAT CTGGGTGGTG ATCCAGGTCT TGCGCCTGAC TGACGGCAAA 
CGCAAGGTGA CGAGCATCCA GGAAATCACC GGCATGGAGG GGGACATTAT CACGATGCAG 
GAAATCTATG CTTTCGAGCA GACGGGTATC GCGGCGGACG GAACCGTGCA GGGCCATTTC 
CGCGCCACCG GCATCCGCCC CAAGTTCGCC GAGCGACTGC GTGTGCATGG GATACCGCTG 
CGCGAGGAGC TGTTCGATCC CTCGCGCCGG TATACATAG

Protein sequence

MSIRERLQSV KETGLAEHHP APVTALHDIP AYEELKARVH QKLLDRVDLA VMESLPAERL 
LMEIRNLVER LLVEESVPIN EAERQGIVRD IQNEVLGLGP LEPLLADPTI SDILVNTHRQ 
VYVERRGRLE LTDTHFANEK HLRKIIDRIV SRVGRRVDES SPMVDARLPD GSRVNAIIPP 
LAIDGSLLSI RRFSVKPLKM NDLMAYKSLT PEMGEIISGL VKGKCSILIS GGTGSGKTTL 
LNIMSGFIPS SERIVTIEDA AELQLQQPHV VRLETRPPNV EGKGEISQRA LVKNSLRMRP 
DRVIIGEVRG AEALDMLQAM NTGHEGSMAT IHANTPRDAL GRVENMVNMA GLNLPIKAVR 
HQISSAIWVV IQVLRLTDGK RKVTSIQEIT GMEGDIITMQ EIYAFEQTGI AADGTVQGHF 
RATGIRPKFA ERLRVHGIPL REELFDPSRR YT