Gene Nmul_A1822 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1822
Symbol
ID	3784917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2080040
End bp	2081326
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	58%
IMG OID	637811909
Product	PepSY-associated TM helix
Protein accession	YP_412511
Protein GI	82702945
COG category	[S] Function unknown
COG ID	[COG3182] Uncharacterized iron-regulated membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.646512
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGAG TGATCACGGT GCCGCCGGGC GTAGCCAGGG CACAGGATAC CCGGCGCGTG 
GAGAAACTTT CGGTCGGGCG CAACTTTCTA GTACTGGCGC ACCGCTGGGC AGGTCTTCTA 
TTGGCCGCGT TTCTTTTCGT ATCCGGCCTT ACCGGCGCGG TCATCTCCTG GGATCATGAG 
CTGGATGAGT GGCTGAACCC CCGGCTCTTC CAGGCCAGGA ATACTGGCGG CATGCCGCAG 
CCTCCACTGC TGCTGGCCGA CCGGCTGGAA GCGGCGGACC CCCGGTTAAT GGTGACCTGG 
CTTCCACTCT CCGTCGAGCC GGGCCATAAC CTTGGGCTGG CGGTGAAGTC CCGTCTCGAC 
CCGGCAACAG GCATGGCCTT CAATCTGGAT TTCAACCAGA TAGCCCTCGA TCCGGTTGAC 
GGGGAAGTGC GTGGCAAGCG CATGTGGGGT GAAATTTCGC TCAGCCGTGA GAACCTGTTG 
CCGTTTCTGT ATAAGCTGCA TTACAGCATG CATATTCCGG ATGGGTTTGG AATCGAGCTG 
GGAATCCTGT TCATGGGGAC TCTCGCGATT ATCTGGGCAC TCGATTGCTT CATTGCTCTG 
TGGATTTCAT TTCCCAAGGC GAGTGCATGG ACCAAATCCT TTGTATTCCG CTGGCGGCAG 
GGAGGAGCAA GGCTGAACTT CGATCTGCAT CGATCCGGTG GGGTGTGGGT ATGGGGATTC 
CTGCTGGTTC TGGCGGTGAC CGCCGTGTCG ATGAATCTCA ACCAGCAGGT CATGCGGCCG 
CTGGTGTCGC TGTTTTCGAC GCTGTCGCCC AGCCCCTTTA CACGTACTCC CAATCCTCCC 
GACCAGCCTA TCGAGCCGAT GGTGGATCGC CACACCATCC TGCAGTATGC GATAACCGAA 
GCGGAAAAGC GTGAATGGAG CACGCCTCCC GGCGGCATAT TTTATGATCC CGAGGTAGGT 
GTTTATGGTG TCATCTTCTT CGAACCGGGG AACGACCATG GCGATGCGGG GCTGGGGAAC 
CCCTCGCTTT TCTTTGACGG CAAGGATGGA ACATCCGTCG GAGCGAATGT GCCGGGTGAG 
GGCAGTGCGG GTGATATTTT CATGCAGGCG CAGTTTCCGC TGCATTCCGG ACGTATCGTC 
GGGCTTCCCG GGCGCATTTT CGTATCCCTC ATGGGCCTGC TGGTGGCGAT GCTGTCAGTT 
ACGGGAGTGA TCATCTGGCA GAAGAAGCGC TGGGCGCGAA AGAAAACTTA TGAAGGGAGC 
AGGAGAGATA TAGCTGTATT GTCCTGA

Protein sequence

MKRVITVPPG VARAQDTRRV EKLSVGRNFL VLAHRWAGLL LAAFLFVSGL TGAVISWDHE 
LDEWLNPRLF QARNTGGMPQ PPLLLADRLE AADPRLMVTW LPLSVEPGHN LGLAVKSRLD 
PATGMAFNLD FNQIALDPVD GEVRGKRMWG EISLSRENLL PFLYKLHYSM HIPDGFGIEL 
GILFMGTLAI IWALDCFIAL WISFPKASAW TKSFVFRWRQ GGARLNFDLH RSGGVWVWGF 
LLVLAVTAVS MNLNQQVMRP LVSLFSTLSP SPFTRTPNPP DQPIEPMVDR HTILQYAITE 
AEKREWSTPP GGIFYDPEVG VYGVIFFEPG NDHGDAGLGN PSLFFDGKDG TSVGANVPGE 
GSAGDIFMQA QFPLHSGRIV GLPGRIFVSL MGLLVAMLSV TGVIIWQKKR WARKKTYEGS 
RRDIAVLS