Gene Nmul_A1667 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1667
Symbol
ID	3785654
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1904464
End bp	1905621
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	56%
IMG OID	637811753
Product	hydrogenase formation HypD protein
Protein accession	YP_412357
Protein GI	82702791
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0409] Hydrogenase maturation factor
TIGRFAM ID	[TIGR00075] hydrogenase expression/formation protein HypD

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACTTA CCGCTCAGGA GTGGCTAAAA AAAATCCATG AGCTGCCACT CGATCGCCCT 
GTACGTATCA TGAACGTATG CGGAGGCCAT GAGCGTTCGA TTACCATGGC AGGAATCCGA 
AGCGCCCTGC CGGAATGTGT CGAACTCATC GCCGGGCCAG GGTGCCCGGT CTGTGTCTGC 
CCTGAAGAAG ATGTATACCA GGCGATTCAG CTCGCGCTGC GCACCGATAT GATTCTGGTC 
ACTTTCGGTG ATATGCTGCG CGTGCCCGTG AACGTGCCGA AGAAAGAAGT GCGATCCCTG 
GAGCAGGCCA AGGCAGCAGG AGCGGATGTG CGTCCCATTG CCAGTCCGCG CGAAGCAGTC 
AGGATAGCTC AGCAAAACGC GAAACGACAA GTCGTTTTCT TTGCTGCGGG TTTTGAGACC 
ACCACAGCCC CGGTAGCAGC CATGCTGCTG GAGGGGGTAC CGGACAATTT ATCCATCCTG 
TTGTCAGCGC GGCGCACATG GCCTGCGGTC GCAATGCTGC TTGATTCTGA TGCACCAGGC 
TTCGATGGGT TGGTGGCGCC CGGTCATGTT TCCACTGTCA TGGGGCCGGA GGAGTGGAAT 
TTCGTCTTCG AAAAGCATGA CATTCCCACT GCCGTTGCCG GCTTCCAGCC CGTGTCACTG 
CTAGCCGCCA TGTATTCCGT ATTACGCCAA CTGCTTGAAG GGAAGCGTTT TCTGGATAAT 
TGTTATCCTG AGTTAGTGCG GCCCGGGGGA AATCGAGCCG CACAGGCGCA ACTCGCGGAA 
GCATTGAATG ACACGGATGC CAACTGGCGC GGCATTGGTG TTATCCCATC TTCCGGTTTC 
AGTCTCCAAA AGCGCTTCGC AAAGAACGAT GCGCGACTTC AATTCCCCGA TTTCGATACA 
GAGAACCGCA AGCGCGCTGG CCAGATGCCG CCCGGTTGCG AATGCGCGAG CGTAGTCCTT 
GGAAGAATAA ATCCAAACCA GTGCAAGATT TATGGCCATG CCTGCACACC GAAAACACCT 
GTGGGCCCGT GCATGGTGTC GGACGAAGGT GCTTGCCGCA TCTGGTGGGC AGCAGGCGTA 
CGGGAGAACA CGGCCACTGG AGTGAAGACG GTGGCAGATA GCTCTTCTAT TCCGGTGTTA 
CCTGAGAAGC CAGAATAA

Protein sequence

MTLTAQEWLK KIHELPLDRP VRIMNVCGGH ERSITMAGIR SALPECVELI AGPGCPVCVC 
PEEDVYQAIQ LALRTDMILV TFGDMLRVPV NVPKKEVRSL EQAKAAGADV RPIASPREAV 
RIAQQNAKRQ VVFFAAGFET TTAPVAAMLL EGVPDNLSIL LSARRTWPAV AMLLDSDAPG 
FDGLVAPGHV STVMGPEEWN FVFEKHDIPT AVAGFQPVSL LAAMYSVLRQ LLEGKRFLDN 
CYPELVRPGG NRAAQAQLAE ALNDTDANWR GIGVIPSSGF SLQKRFAKND ARLQFPDFDT 
ENRKRAGQMP PGCECASVVL GRINPNQCKI YGHACTPKTP VGPCMVSDEG ACRIWWAAGV 
RENTATGVKT VADSSSIPVL PEKPE