Gene Nmul_A2351 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2351
Symbol
ID	3784755
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2677720
End bp	2678907
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	62%
IMG OID	637812442
Product	hypothetical protein
Protein accession	YP_413034
Protein GI	82703468
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3063] Tfp pilus assembly protein PilF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.212242
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCAGAA TCAAGCAGCT TGCATGGGCG ATGGGTTGCG TATCGCTCAT GAGCGGGTGC 
ACGTTGTATC CGTGGTATCA GAACAAGGCC GGGCAGGCTG TTAACGTCAA GCCGGTGATG 
GAAGTCCGCC ACGCGATTCG CAGTGCGGAC GCGCTGTATC AGCTTGGACG ATATTACCAG 
GCCAAGGTCG ACTATGCGGA AGCCATTGCA GCCTACGAGA AGGCGCTGGA GGCAGACCCT 
CGTCATGTCG AGGCGCACAA TGGCCTGGGC GTGGCCCATT GCCTTCTGGA CCGGCATGAA 
CTGGCGCTGC AGTATTTCCG GAAAGCGATC GGGATGGCCC CCCTGGCCGC CCATCTGCAC 
AATAATCTAG GCTATGCCCA CCTGGTGCAC GGACAGGAAG CTGAAGCCGT GTCAGCGTTC 
GAGCGGGCGC TGTTGCTCGA GCCTCACAAC CAGCGGGCGC GACGCCACCT CGCCGCCGTC 
TACAAAAAGG CGGGACTGCA CGACAAGGCT GCTGCGCTGA CCGTGGCACC CTCTGGAGCC 
CCTGTGGGAG CCACCAAGGC ACCCCCCACG GCACCCATAC CAACGCCTGC TCCCGGCACT 
CCTGCCGGTA CTCCCGCTGG TATTCCTTCT GCTGCCATAT CGGCCATATC GCCTCCCATG 
GCAGCCGCAC CGGGCGAGAA ACAGAAGTTG TCATGCAGCG CCGCAGCGCG ACTGCTGCAG 
GTTACACCCG GTGTGTTCGA GTTCCGGATG GCCGAAACGG AGGCGATGAC AGCCATGCCT 
TCGGGTAAAA TCATCGGCAG GACCGCTCCC CCGCAGGATT CGGGCAAGTT TTCCGGCCAG 
GACATCCGCA TCGAGGTCTC GAATGGCAAT GGCTTACCCG GCATGGCCAG GCAGGTATCC 
GATTTTCTGC AGCAGAACGG GTTCGCCAGG GCACGCCTCA CCGACCGGCA GCCGTATCAG 
CAGGCCCTGA CGGAAATACA CTATCGGCCG GGCCATTCCG GAGTGGCCGA GGAGATCAGC 
CGGTTGATGC CAGGGGGGAG CGGGGTCCCC ACAGTGGAGA GTTATAATCT CCGCAGGGAC 
ATTCATGTGC GGGTGATGCT GGGCAAGGAC GCTGTGCGCC AGGTAGCTCA CCTGGAGAGT 
CCGCAAAAAG TGCAGATTGC GCAAGGAACT GCCGGAGCCG TCGAGTAA

Protein sequence

MFRIKQLAWA MGCVSLMSGC TLYPWYQNKA GQAVNVKPVM EVRHAIRSAD ALYQLGRYYQ 
AKVDYAEAIA AYEKALEADP RHVEAHNGLG VAHCLLDRHE LALQYFRKAI GMAPLAAHLH 
NNLGYAHLVH GQEAEAVSAF ERALLLEPHN QRARRHLAAV YKKAGLHDKA AALTVAPSGA 
PVGATKAPPT APIPTPAPGT PAGTPAGIPS AAISAISPPM AAAPGEKQKL SCSAAARLLQ 
VTPGVFEFRM AETEAMTAMP SGKIIGRTAP PQDSGKFSGQ DIRIEVSNGN GLPGMARQVS 
DFLQQNGFAR ARLTDRQPYQ QALTEIHYRP GHSGVAEEIS RLMPGGSGVP TVESYNLRRD 
IHVRVMLGKD AVRQVAHLES PQKVQIAQGT AGAVE