Gene Nmul_A2752 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2752
Symbol
ID	3785723
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	3154617
End bp	3155975
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	56%
IMG OID	637812843
Product	acetyl-CoA carboxylase, biotin carboxylase
Protein accession	YP_413431
Protein GI	82703865
COG category	[I] Lipid transport and metabolism
COG ID	[COG0439] Biotin carboxylase
TIGRFAM ID	[TIGR00514] acetyl-CoA carboxylase, biotin carboxylase subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGAAA AAATACTGAT AGCAAACCGT GGCGAGATTG CCTTGCGGAT ACAGCGTGCA 
TGCCGTGAGA TGGGTATCAA GACTGTAGCG GTGCACTCCC AGGCCGATGC CGAGGCAAAA 
TATGTAAAAC TCGCTGATGA GTCCGTATGC ATCGGACCTG CTCCTTCGGC ACAAAGCTAC 
CTCAATATTC CCGCCATCAT CAGCGCCGCA GAGGTCACCG ATGCGGAAGC CATTCATCCG 
GGTTACGGGT TTCTGTCGGA AAATGCCGAT TTTGCCGAAC GTGTGGAAAA AAGCGGCTTC 
GTCTTTATCG GCCCGCGGCC CGAGACGATT CGGCTGATGG GCGACAAGGT CAGTGCCAAG 
AACGCCATGA AAAAGGCGGG CGTGCCTTGT GTCCCGGGCT CGGACGGCGG TCTCCCCGAA 
TCGGTGGACG AAATCAAAGC CATCGCTCGT GCCATCGGCT ACCCTATCAT TATCAAGGCC 
GCGGCAGGTG GGGGCGGCCG TGGCATGCGC GTGGTGCACA CTGAAGCAGC GTTATCGAAC 
GCGGTGATCA TTACGCGCAA CGAAGCTCAG GCCGCCTTCG GCAACCCGAC GGTCTACGCC 
GAAAAATATC TGGAGAACCC GCGCCACATC GAGTTTCAGG TATTGGCGGA TGAGCATCGC 
AACGCCATCT ATCTGGGGGA ACGGGATTGC TCCACGCAGC GCCGCCATCA GAAAATTATC 
GAGGAAGCAC CTGCCCTGGG CATTCCCCCC AGATTGCGCG ACAGAATGGG AACCCGTTGC 
GTCGACGCAT GCAAGCGCAT CGGCTATCGC GGTGTGGGTA CATTCGAGTT TCTGTTCGAA 
AAAAACGAGT TCTATTTCAT TGAGATGAAT ACGCGCCTGC AGGTCGAGCA TACCATTACC 
GAGGCCATCA CCGGGATCGA TCTGGTGCAA GCGCAGATCC GCGTGGCAGC CGGCGAAAAG 
CTCACTCTGC GGCAGCGCGA CATCGTGTTG AAGGGTCATG CCATCGAATG CCGTATCGCG 
GCCGAAGACC CGTACAAGTT CACCCCGTCG GCAGGGCGTA TCACCCAGTA TCATGCTCCC 
GGTGGCCCTG GCATTCGTGT GGATTCCCAT ATATATCATA ACTACTTCGT GCCGCCCTAT 
TACGATTCCA TGATAGGCAA AATAATCGCG TATGGAGACA ACCGCGAGCA GGCGATAGCA 
CGAATGCGCA TTGCGCTGTC GGAAATGGTG ATCGGCGGCA TCAAAACCAA TACGCCGCTC 
CACCTTGACC TGTTGTCCGA CGCCGCTTTT CTGAATGGCT GCACGAGCAT TCATTATCTG 
GAGCAAAAGC TTGCCAATTA TAATAACAAT TCCGGCTGA

Protein sequence

MFEKILIANR GEIALRIQRA CREMGIKTVA VHSQADAEAK YVKLADESVC IGPAPSAQSY 
LNIPAIISAA EVTDAEAIHP GYGFLSENAD FAERVEKSGF VFIGPRPETI RLMGDKVSAK 
NAMKKAGVPC VPGSDGGLPE SVDEIKAIAR AIGYPIIIKA AAGGGGRGMR VVHTEAALSN 
AVIITRNEAQ AAFGNPTVYA EKYLENPRHI EFQVLADEHR NAIYLGERDC STQRRHQKII 
EEAPALGIPP RLRDRMGTRC VDACKRIGYR GVGTFEFLFE KNEFYFIEMN TRLQVEHTIT 
EAITGIDLVQ AQIRVAAGEK LTLRQRDIVL KGHAIECRIA AEDPYKFTPS AGRITQYHAP 
GGPGIRVDSH IYHNYFVPPY YDSMIGKIIA YGDNREQAIA RMRIALSEMV IGGIKTNTPL 
HLDLLSDAAF LNGCTSIHYL EQKLANYNNN SG