Gene Nmul_A2687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2687
Symbol
ID	3785049
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	3087056
End bp	3088270
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	57%
IMG OID	637812777
Product	HemY-like
Protein accession	YP_413366
Protein GI	82703800
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG3071] Uncharacterized enzyme of heme biosynthesis
TIGRFAM ID	[TIGR00540] hemY protein

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAGGGGG CGCTCTGGCT TCTGGCCCTG TTCATGATTG CCGTGGCGGT TACCATCGCC 
GCCACTTATA ACAGCGGCTA CGTGCTGATT GTCGCCCAGC CCTATCGTAT AGAGCTGTCG 
CTGAATCTGC TGGTGCTATT GCTGCTGGCC ATCATTTTGA TGGGTTACCT GGGAATGCGA 
CTTATTGCAT TTACCGCCCG GCTGCCTGCC GAGCTGAGTG AATTTCGCAC TCGCAGGCGT 
CGGGAAAAGG CTCTGGAAGG AACGCTGGAG GGTCTCAAGG CGTTTTTCGA GCGGCGTTAT 
GCGAAGGCGG AGAAATCCGC CGCCACCGTC CTGAAAATGG AGGATTCCAC CGCTTTCAGC 
GCCATCAATG CCATCGTTGC CGCGCGTGCA GCCCATGGAT TGCGAAATTA TTCCCGCCGG 
GACGAGTTCA TTGCACAGGC CGAAACCAGC GCGCCGCAAG AAGTGGCATT GCGGCTGATG 
ACACAGGCTG AATTGCTTCT GGACGAACAT CGACCTGAAG AAGCGCTCCG GCTGCTGCAC 
CACCTGCCTC CCGGCGAGTT GCGCCGACAT CCGGGTGCCC TGAAGCTGGA GCTGGAAGCC 
CAGCAGAACG TTGGAAACTG GAATGCGGTG CTTGAATTGC TCGGCCAGCT GGAACAGCAC 
GATGGTCCTG AGGCAAGCCT CGTAAAACAA CTGAGAGGCA GAGCGCATAT AGAGAATCTC 
AGAAGCAGAA TGTTGAATCC GCAGGCACTG AAGGAGTATT GGGAGAGCCT GTCTCCGTCG 
GAAAAAAAGG ATGGCAAAGT TGCTGCTGCG GCCGCACGCG CGTTTTCTGC AACAGGAGAT 
TGCGCCATGG TGCATCATAT AGTCGAGCAG AGCCTGGAGA CCCAATGGGA TTCGGAATTG 
GCCAGGCTCT ATGCGGAATG CGCCGGCAGC GATCCCTTGC GGCAGATAGA ACGTGCCGAG 
GCATGGCTTG AAAGGCATTC CAGTGATGCA TCCCTGCTGC TAGCTCTGGG AAAGCTCTGC 
GTCAATGGGG AACTGTGGGG CAAGGCTCAG AGCTATCTTG AAGCCAGTTT ATCGGTCAAA 
CCGGGATATG CGGCGCACCT CGCGTTGGGA CAGCTGAATG AGAAGCTCGG GCAGCCCGAA 
CTGGCAAGGG AGCACTACGG CAAAGGACTG GAACTGGCTG TAAGGCAGCT GGAAACAGCC 
GCAATGGCCG AATAA

Protein sequence

MKGALWLLAL FMIAVAVTIA ATYNSGYVLI VAQPYRIELS LNLLVLLLLA IILMGYLGMR 
LIAFTARLPA ELSEFRTRRR REKALEGTLE GLKAFFERRY AKAEKSAATV LKMEDSTAFS 
AINAIVAARA AHGLRNYSRR DEFIAQAETS APQEVALRLM TQAELLLDEH RPEEALRLLH 
HLPPGELRRH PGALKLELEA QQNVGNWNAV LELLGQLEQH DGPEASLVKQ LRGRAHIENL 
RSRMLNPQAL KEYWESLSPS EKKDGKVAAA AARAFSATGD CAMVHHIVEQ SLETQWDSEL 
ARLYAECAGS DPLRQIERAE AWLERHSSDA SLLLALGKLC VNGELWGKAQ SYLEASLSVK 
PGYAAHLALG QLNEKLGQPE LAREHYGKGL ELAVRQLETA AMAE