Gene Nmul_A0030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0030
Symbol
ID	3784019
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	30847
End bp	32124
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	63%
IMG OID	637810099
Product	hypothetical protein
Protein accession	YP_410731
Protein GI	82701165
COG category	[S] Function unknown
COG ID	[COG2733] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.29018
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCCTA TCGAATCGTC AGCCTCGAGT CGCCACACGA GCTCTCTGAA GCGATCACTT 
GCCGATAACC GGATGGGGCG TCTGGCGACG GCGCTGCTGA TGGTGATGCT TGCGGTTCTC 
GTTCTGACCA ACATATTTCT TCCGGTTCAT CCCGCGATGG GCTACGTTCG CGCTTTTGCC 
GAAGCTGCGG TAGTGGGCGC GCTGGCGGAC TGGTTTGCCA TAACGGCGTT ATTCCGCCAG 
CCCCTCGGCC TGCCCATTCC CCACACTGCA ATCATTCCGC GTAACAAGGA TCGCATCGGG 
GAATCGCTGG GACGCTTCGT GGAGAGCAAC TTTGCTTCTC CCGAAGTGGT TGCCGCCAAG 
CTTGCGCCTG TGGATTTGTC CGGGAAACTG GCAACGTGGC TGTGCGGGGA GGCGCGTACC 
GACCTGCTGG CGGATTATGT GACGCACCTG ATTCCGGAAT TGCTGGATTC GGTGGACGAG 
CGCCATGTGC AGCATTTCGT TTCGGCCGGG GTGCTGGAAA AAGCGGGGCG CATCGATCTT 
GGCCCTTTGC TCGGGGAGGC GGTGAGGATG CTCACTGCGG AAAAGCGGCA CCAGCGGCTG 
CTGGACAAGC TGTTGCGCGA GGCTGATGAA TATGTGACCG CGAACGAATC CCGTATCCGT 
CAGCGGGTGC GCGAAAACAC AGCCTGGTTC TGGCAGCGGC TTTCGATGGA TGAGAAGGTG 
GGGGAAAGCG TGGTGGCAGC CCTGCGCGAG GTGGTGGCGG AGATCGCGCG CGACCCTGCC 
CACCCCCTGC GCTTGCGACT GGATGCTGCC ATCGGCAAGC TTGCCTCCGA CCTGGCTACT 
TCACCCGAGT ATCGCGAGCA GGTTGCCGCC CACACCCGCA AGCTGCTGGA GCATCCGGCC 
TTGCGGGACT ACGCGGACGG AGTCTGGCGC GACCTCCGCA ACGGGATGCG CGAGGACATC 
GACAGCGAGG ACTCGGCAAT CAGGGGGTGG ATGCGGGGCC TCATACAGTC GGGCACCGAT 
ACTGTACTTG AGGACCGTGG TTTGCGGGAG CGGCTCAATA ACTGGATGCG GGAGGTGCTG 
GTGGAAGCGG TGCAGTCTCA CCAGCGCGAT GTGGGCAGGC TGATTGCCGA CACCGTGCGG 
GAGTGGGACA CGCAGACAGT GACGCACCGC ATCGAGCGGC AGGTGGGCGA GGACCTGCAG 
TACATCCGCA TCAATGGCAC GCTGATAGGC GGACTGGCAG GCCTGGCGAT CTACACCATC 
GCCCACCTGT TCGCTTGA

Protein sequence

MQPIESSASS RHTSSLKRSL ADNRMGRLAT ALLMVMLAVL VLTNIFLPVH PAMGYVRAFA 
EAAVVGALAD WFAITALFRQ PLGLPIPHTA IIPRNKDRIG ESLGRFVESN FASPEVVAAK 
LAPVDLSGKL ATWLCGEART DLLADYVTHL IPELLDSVDE RHVQHFVSAG VLEKAGRIDL 
GPLLGEAVRM LTAEKRHQRL LDKLLREADE YVTANESRIR QRVRENTAWF WQRLSMDEKV 
GESVVAALRE VVAEIARDPA HPLRLRLDAA IGKLASDLAT SPEYREQVAA HTRKLLEHPA 
LRDYADGVWR DLRNGMREDI DSEDSAIRGW MRGLIQSGTD TVLEDRGLRE RLNNWMREVL 
VEAVQSHQRD VGRLIADTVR EWDTQTVTHR IERQVGEDLQ YIRINGTLIG GLAGLAIYTI 
AHLFA