Gene Nmul_A2141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2141
Symbol
ID	3784767
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2433113
End bp	2434282
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	54%
IMG OID	637812229
Product	Fatty acid desaturase
Protein accession	YP_412826
Protein GI	82703260
COG category	[I] Lipid transport and metabolism
COG ID	[COG1398] Fatty-acid desaturase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.623834
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTCTCG GTCTTATCGA CTTGCCATGG TGGGGTTATA TCGCCGTTAC CCTCGGCCTT 
ACCCACATAA CCATAGCCAG TATCACAATC TTTCTGCATC GTCATCAAGC TCATCGCTCG 
CTGGATCTTC ATCCCTTGCC GAGTCATTTT TTCCGCTTCT GGCTGTGGCT CACGACCGGG 
ATGGTCACCA AGGAGTGGAC CGCCATACAC CGGAAGCATC ATGCCAAGTG TGAAACGGTC 
GATGATCCCC ATAGTCCGCA AATAGTGGGG ATCGCCAAAG TGCTGCGGGA GGGATCGGAG 
CTCTACCGCG CAGAAGCCAA AAACATGGAA ACCATGGAAA GATACGGCCA TGGTACGCCG 
GATGACTGGC TGGAGCGGAA TGTCTATGAC AAGCACAGCC GCAAGGGGGT GGCCCTCATG 
CTGATCATCG ACGTCATTCT GTTCGGACCC ATCGGCCTGA CCATCTGGGC CATCCAGATG 
GCATGGGCGC CCATCATGGC TGCGGGCGTG ATCAATGGGA TAGGACATTA CTGGGGCTAC 
CGTAATTTCC AGGCCGAAGA CGCCAGCACC AATATCGTTC CCTGGGGAAT TCTCATTGGC 
GGAGAGGAGT TGCACAACAA CCACCACGCT TATGCCACTT CCGCGCGCTT ATCCAACAAG 
TGGTATGAAT TCGACATCGG CTGGATGTAT ATTTGCATTC TCCAGTGGAT GGGGTTGGCG 
CAAGTGAAGA AGGTGGCGCC GAAACTGCGC CTCGATGCCG CAAAGACAGA ATGCGACGCA 
GATACGCTGC AAGCTGTCAT TTCCCATCGC TACGAAGTAC TGGCAAAGTA TGCCCAGTCT 
CTCAAGCAGA CGCTGGCAAA GGAAGTTGAT CATCTGAAAG AAGCGGCGAC AAATCTTGGC 
GTCGATCGTT CCACACTCAA GCGTTGGGTA CTTGCGGACT CCAAGACCCT GCAGGAAGAC 
GAGCGGGCAA AGCTCAATCT AGTGCTGAGC AAGACGAGTA CGCTGGATAA AGTTTACAAA 
ATGCGCGAGG AATTGATAAC GGTATGGCAA CGCTCCACTT CATCCAAGGA TGAGCTGGTC 
AAGCAGCTGG AAGACTGGTG TCACCGCGCC GAGGAAAGCG GCATCGAGGT ATTGCAGAAT 
TTCTCCCGCA GGCTGCGCTG CTACGCTTAG

Protein sequence

MTLGLIDLPW WGYIAVTLGL THITIASITI FLHRHQAHRS LDLHPLPSHF FRFWLWLTTG 
MVTKEWTAIH RKHHAKCETV DDPHSPQIVG IAKVLREGSE LYRAEAKNME TMERYGHGTP 
DDWLERNVYD KHSRKGVALM LIIDVILFGP IGLTIWAIQM AWAPIMAAGV INGIGHYWGY 
RNFQAEDAST NIVPWGILIG GEELHNNHHA YATSARLSNK WYEFDIGWMY ICILQWMGLA 
QVKKVAPKLR LDAAKTECDA DTLQAVISHR YEVLAKYAQS LKQTLAKEVD HLKEAATNLG 
VDRSTLKRWV LADSKTLQED ERAKLNLVLS KTSTLDKVYK MREELITVWQ RSTSSKDELV 
KQLEDWCHRA EESGIEVLQN FSRRLRCYA