Gene Nmul_A1017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1017
Symbol
ID	3786542
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1176644
End bp	1177921
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	60%
IMG OID	637811101
Product	NADH-quinone oxidoreductase, F subunit
Protein accession	YP_411712
Protein GI	82702146
COG category	[C] Energy production and conversion
COG ID	[COG1894] NADH:ubiquinone oxidoreductase, NADH-binding (51 kD) subunit
TIGRFAM ID	[TIGR01959] NADH-quinone oxidoreductase, F subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAACAC CGCTGACGCA TAACATTTCA CCGGGCAGGG AACCTCCGGA TCTTGCGCAG 
TACGAGAAGG CCGGAGGTTA TGGCGCGCTG CGCAAGGCGC TCGGTATGGC GCCGGCGGAA 
ATTCAGGCAG CGGTCAAGGA ATCCAACCTG CGCGGCCGTG GCGGAGCGGG GTTTCCAACT 
GCACAGAAAT GGAGTTTTGT GCCGATGGGC GATGATGCGC CGCGGCCCAA GTATCTCGTT 
TGCAATGCCG ACGAGATGGA GCCGGGTACA TTCAAGGATC GTATGTTGCT CGAGGGAGAC 
CCCCATCAGT TGATCGAAGG CATTATCATC AGCGCCTATG CGATCCAGGC CGATGTGGCT 
TACGTATTTC TGCGCTGGGC CTACAAACTG GCGGCCCGGC GCGTGGAGCG CGCAATCGTT 
GAAGCATACC GCCACGGCTA CCTGGGTAAA AATATCCTGG GCTCGGCTTA CAGTCTGGAG 
ATGCACCTGC ACGTCAGTGC GGGACGCTAC ATATGCGGAG AGGAGACCGC GCTGCTCAAT 
GCCCTCGAAG GCAAGCGCGC CAACCCACGG GCCAAACCTC CCTATCCCCA GGTGAGTGGC 
CTGTGGGGAA AGCCTACCAT TGTCAATAGC GTGGAAACCT TGTGCAACGT TCCGCATATC 
GTGAAGCAGG GGGCCGAATG GTTCAGGAGC CTGAGCCGCA GCGACGACGG CGGAACGAAG 
CTGTATGGGG CAAGCGGGAG AGTGAAGAAC CCGGGATTAT GGGAATTGCC CATGGGCACT 
CCTCTGCGCG AGATTCTGGA AGAGCATGCG GGCGGCATGC GTGACGGCTA TCAGTTTCGC 
GGGGTGCTGC CGGGTGGCGC TTCGACTGAT TTTGTTACTG CCGAGCACCT CGACGTGGCG 
ATGGATTTCG ATTCGGTGCA GAAGGCCGGC AGCCGCCTCG GCACCGGCAC CATGATCATC 
CTTGATGACA AGACCTGCCC CGTTGGCATG CTGCTCAATC TGGAACATTT CTTCGCCCAG 
GAATCATGCG GCTGGTGCAC CCCGTGCTGG TCGGGGCTTT CCTGGATCGA ACAGATATTG 
CAGGACATGG AGGAGGGTCG CGGCCGGGCT TCCGACCTTG AATTGCTGGA ATCCCATACG 
CGCCTCCTGG GTCCCGGACA TACTTTTTGT GCGCTTGCCC CCGGAGCGGC CGAGCCCCTG 
CAAAGCGGCC TCAAGTATTT CCGTGATGAT TTCGAGCGCC ATATCCATGA GAAACGCTGT 
CCCTGGAGCC CGACGTGA

Protein sequence

METPLTHNIS PGREPPDLAQ YEKAGGYGAL RKALGMAPAE IQAAVKESNL RGRGGAGFPT 
AQKWSFVPMG DDAPRPKYLV CNADEMEPGT FKDRMLLEGD PHQLIEGIII SAYAIQADVA 
YVFLRWAYKL AARRVERAIV EAYRHGYLGK NILGSAYSLE MHLHVSAGRY ICGEETALLN 
ALEGKRANPR AKPPYPQVSG LWGKPTIVNS VETLCNVPHI VKQGAEWFRS LSRSDDGGTK 
LYGASGRVKN PGLWELPMGT PLREILEEHA GGMRDGYQFR GVLPGGASTD FVTAEHLDVA 
MDFDSVQKAG SRLGTGTMII LDDKTCPVGM LLNLEHFFAQ ESCGWCTPCW SGLSWIEQIL 
QDMEEGRGRA SDLELLESHT RLLGPGHTFC ALAPGAAEPL QSGLKYFRDD FERHIHEKRC 
PWSPT