Gene Nham_1040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nham_1040
Symbol
ID	4031646
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter hamburgensis X14
Kingdom	Bacteria
Replicon accession	NC_007964
Strand	+
Start bp	1161678
End bp	1162694
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	62%
IMG OID	637969538
Product	molybdopterin dehydrogenase, FAD-binding
Protein accession	YP_576348
Protein GI	92116619
COG category	[C] Energy production and conversion
COG ID	[COG1319] Aerobic-type carbon monoxide dehydrogenase, middle subunit CoxM/CutM homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAATT TCCAGTACTC GCGCGCAACC GACGTTGCTG ACGCCCTGAG TCAGATCGCG 
GCCGATGCCT CGGCAAAGTT CATTGCCGGC GGCACCAATC TCGTCGACCT GATGAAATAC 
GACGTCGAGC GCCCCGGCCG GCTGATCGAC ATTTCGCACC TTCCGCTAGC CAAGGTCGAG 
GAAACGACCG GCGGCGGTCT GCGCATCGGC GCACTGGTGC CGAATTCCGA CCTCGCCTGG 
CATCCACTGG TGATGGAACG CTATCCGCTG CTGTCGAGCG CCATCCTCGC CGGCGCCTCG 
GCCCAACTGC GCAACATGGC GTCCACCGGC GGCAACCTGC TGCAGCGGAC CCGATGCTTC 
TATTTCTATG ATGTCGCGAC ACCATGCAAC AAGCGCGAGC CCGGTTCCGG CTGTTCGGCA 
AAAGACGGTA TCAACCGGAT CAACGCCATC CTCGGCACCA GCGATGCCTG CATCGCCACC 
CATCCCTCCG ACATGTGCGT CGCGCTGGCG GCGCTCGATG CCAAGGTGCA TATCGCCGGC 
CCCGACGGTG AGCGCGCCAT TGCCATGGCG GATTTCCATC GCCTGCCCGG CGACACGCCA 
CAGCGTGATA CCAATCTCGA TCCGAAAGAA ATCATCACGG CCATCGAACT GCCAGCGCAG 
CGCTTCAACA AGCACTACAC CTATCTGAAG ATCCGGGATC GTTTGTCCTA TGCCTTCGCG 
CTGGTCTCGG TCGCGGCCGC GCTCGAGATC GATAGCGGCA CAATCCACGA TGCGCGGCTG 
GCGCTCGGCG GTGTGGCCCA CAAGCCGTGG CGGAATCCGG AAGCCGAAGC AGCCTTGATC 
GGACAGCCCG CCACTCACGA CACCTTCGCT CGCGCGGCCG ACATCGTTCT GCACGAGGCT 
AAGGGTTTCG GCCACAATAC CTTCAAGATC GACCTCGCTC GGCGCGTCAT CGTTCGCGGG 
TTGACGCAAG CCGCGAACGG CACACCGCAA TCGCAATCTA ATAAGACAAT CGCATGA

Protein sequence

MNNFQYSRAT DVADALSQIA ADASAKFIAG GTNLVDLMKY DVERPGRLID ISHLPLAKVE 
ETTGGGLRIG ALVPNSDLAW HPLVMERYPL LSSAILAGAS AQLRNMASTG GNLLQRTRCF 
YFYDVATPCN KREPGSGCSA KDGINRINAI LGTSDACIAT HPSDMCVALA ALDAKVHIAG 
PDGERAIAMA DFHRLPGDTP QRDTNLDPKE IITAIELPAQ RFNKHYTYLK IRDRLSYAFA 
LVSVAAALEI DSGTIHDARL ALGGVAHKPW RNPEAEAALI GQPATHDTFA RAADIVLHEA 
KGFGHNTFKI DLARRVIVRG LTQAANGTPQ SQSNKTIA