Gene Nmul_A1669 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1669
Symbol
ID	3785656
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1908009
End bp	1909013
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	61%
IMG OID	637811755
Product	hydrogenase expression/formation protein HypE
Protein accession	YP_412359
Protein GI	82702793
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0309] Hydrogenase maturation factor
TIGRFAM ID	[TIGR02124] hydrogenase expression/formation protein HypE

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGGATA GGCACGTCAG CTTGGCCCAT GGCAATGGCG GCAGTTACAT GCGGGAGCTG 
ATCGAAACCG TGTTTGCGCG CCATCTTTCC AACCCCTTGC TCGATGTACA GGCGGATGCC 
GCGGCCTTAC CTCCCATGGA TGGGGTGATA ATGATAACCA CGGATGGCTT TACTGTGCAG 
CCGCTGGAGT TCCCGGGGGG CACGATCGGT TCCCTGGCGG TGCACGGAAC CGTAAACGAC 
CTGGCCGTAT CCGGCGCCCG GCCCTGCTAT CTCACGCTCA ACGCCTTTAT TGAGGAAGGC 
TTCGATATGG CGCAGTTGGA ACGCATTGTG GCGAGCCTGG CCAGTGCGGC ACGGGAGACG 
AATGTCGCTG TGGTAGCGGG TGACACCAAG GTTCTTCCGC GCGGGCAAGG GGGCGGGCTG 
TATCTTGCCG CCACCGGAGT AGGTGTGAGG CCACCAAATC TGGAGCTTGG CCTCGACCGG 
GTAAAACCGG GAGACCTCAT CCTCGTAAGC GGTCCGGTAG GCGATCATGG CGTTGCCGTT 
ATGCTGGCCC GCGAGCAATT TGGCTTGAGC GGCGAATTGC TGTCGGACGC AGCCAGTGTG 
CTTCCCTTGA CGCAGGCATT AGTACCGTTG CCGGGCCTGC ATTTCATGCG CGACCCCACC 
CGGGGCGGGC TTGCTACCGT TCTGCATGAA ATCTGCCGCG CCACAGGACT GGAAACGCGG 
CTCAACCAGG CGGCGGTTCC GGTACGCGAT CAGGTAGCGT CGGTATGCGA AATGCTGGGG 
TATGATCCTT TTTACCTGGC TTGCGAAGGG CGGGTGGTGG CGGTGGTGGA ATCCCCTCAG 
GCGAGCGAAG CGCTTGCCCG ATTGCAGGCG CTGCCGCAGG GCTGCCAGGC CGCGATTATT 
GGAAGTGTGA ACCATGGCCG TCCGCACGTC GTACTTGAAA CCGAACTGGG GGGAGAGCGT 
ATTCTGGATG AACTGGAGGA TGATCCGCTC CCCCGGATAT GCTAG

Protein sequence

MEDRHVSLAH GNGGSYMREL IETVFARHLS NPLLDVQADA AALPPMDGVI MITTDGFTVQ 
PLEFPGGTIG SLAVHGTVND LAVSGARPCY LTLNAFIEEG FDMAQLERIV ASLASAARET 
NVAVVAGDTK VLPRGQGGGL YLAATGVGVR PPNLELGLDR VKPGDLILVS GPVGDHGVAV 
MLAREQFGLS GELLSDAASV LPLTQALVPL PGLHFMRDPT RGGLATVLHE ICRATGLETR 
LNQAAVPVRD QVASVCEMLG YDPFYLACEG RVVAVVESPQ ASEALARLQA LPQGCQAAII 
GSVNHGRPHV VLETELGGER ILDELEDDPL PRIC