Gene Nmul_A2082 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2082
Symbol
ID	3786086
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2374239
End bp	2375228
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	53%
IMG OID	637812171
Product	biotin--acetyl-CoA-carboxylase ligase
Protein accession	YP_412768
Protein GI	82703202
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0340] Biotin-(acetyl-CoA carboxylase) ligase
TIGRFAM ID	[TIGR00121] birA, biotin-[acetyl-CoA-carboxylase] ligase region [TIGR00122] BirA biotin operon repressor domain

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCCAT TCACTTTTTC CATTCTCCGG GTGCTGAGCG ATAACGAATT TCATTCAGGG 
CAGGCTATCG CCGAAGCTCT GGGAGTTTCC CGCGCCAGTG TATCGAATGC TCTTCGCGAC 
GCGGATGAAG CTGGATTGAC CATTCATAAA ATCAAGGGAC GCGGCTATCG CCTGCTCGAC 
CAGGTGCAAT GGCTGGAACG AAATGCAATT CTTGAGCACC TCGGTCATCA GGCGGACAAA 
TTCAATCTGG AAATACTCGA TACGATCGAT TCCACCAACA GCCTTTTACT GCATGAGGCG 
GATAACCGGT TGAGCCTGCG TGATGGGCTC ATTCATGTGG TAGCGGCCGA GCTGCAAACG 
AAGGGGCGTG GACGACGAGG ACGGCAATGG CACTCGGGCC TGGGAGTCGG TCTCGCGTTT 
TCCGTGCTAT GGCGGTTTCA GCAAAGTGCA AGCTTTCTTT CGGGTTTGAG TCTCGCCACA 
GGCGTTGCAA TAGTACGTGC GCTCGAATCT TCAGGGATAC AAGGGGCCGT ACTCAAATGG 
CCAAACGATG TGATGTTCAA TTTCTGTAAA CTGGCAGGTA TATTGATAGA ACTGCATGGC 
GATATGCTCG GTCCCACCGT TGCTGTAATC GGTGTAGGCA TGAACCTGAA ATTGTCCGAC 
AGCGTTCAGG CGCGGATAGA CCAGGGGGCA ACGGATATTT TTTCCATCAG TGGAGAAACA 
CCGGATCGCA ATAAATTGCT GGCTGAATTG TTGCTGAATA TTGCTCGAGT ATTGAGAGAA 
TTTGAGCAGT CGGGTTTTAC GCCATTCAAG GAGGAATGGG TGGATCGCCA TGTATGTGAA 
GGCAAAGCCG TCACCCTCAA GCTACCTGAC GGGTCGGGCC AGGAAGGACT GGTGCACGGG 
GTATCGGATA GCGGGTCGCT GTTGCTGCAA ACGTCACTGG GTCTTCGCAG TTTCAGCGGC 
GGCGAGATAT CGCTGCGCAG GACAGCATAA

Protein sequence

MNPFTFSILR VLSDNEFHSG QAIAEALGVS RASVSNALRD ADEAGLTIHK IKGRGYRLLD 
QVQWLERNAI LEHLGHQADK FNLEILDTID STNSLLLHEA DNRLSLRDGL IHVVAAELQT 
KGRGRRGRQW HSGLGVGLAF SVLWRFQQSA SFLSGLSLAT GVAIVRALES SGIQGAVLKW 
PNDVMFNFCK LAGILIELHG DMLGPTVAVI GVGMNLKLSD SVQARIDQGA TDIFSISGET 
PDRNKLLAEL LLNIARVLRE FEQSGFTPFK EEWVDRHVCE GKAVTLKLPD GSGQEGLVHG 
VSDSGSLLLQ TSLGLRSFSG GEISLRRTA