Gene Nmul_A0968 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0968
Symbol
ID	3785759
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1124942
End bp	1126603
Gene Length	1662 bp
Protein Length	553 aa
Translation table	11
GC content	57%
IMG OID	637811051
Product	AMP-dependent synthetase and ligase
Protein accession	YP_411663
Protein GI	82702097
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.809053
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCATT CCGGCATCCT GGATATGGTC CCCGCCGAGG TCCGCGCGCA ATGGGCCCGG 
CAGGGAATCT ATCCGAATAA ATCCCTGTAC GAGTTGTTTT GCGAGCGAGT GGAGCAACAG 
CCGGATAATC CGGCAGTAAT ATCGCTCGAC CATACCACCA GTTACGCAGC GTTGCTGGAC 
AAGGTCCATC GCCTGGCAAC CAGTTTCCAG GAATTGGGCA TTGTTGCGGG CGATGTAATC 
TCATACCAGC TTCATAACGA CTGGCGGAGC TGCGCGATCG ACCTGGCGGC GGCCGCGCTT 
GGAGCCATCG TGGCACCTTT TCCGCCAGGC CGCGGCCGCC TCGATATCCA GTCCCTGCTC 
AGACGCTGTG ACGCCCGTGC AATTATTGTC GAGCGCGAAT ATGGAAAAAC CGACCTTTGC 
GAATTGATCG AATCCATACG CCCCACTTTG CTTTCACTGC GCATCCTCGT GGTCGATGGC 
GCAGCCGGAG ACGGTTGGCA CGCACTGGAT GAATTGTTCC GGCCCGCCTC CATTGAACCG 
GACCTGCCGA CAGTCTGCCC CGATTCACCT GCCCGTTTCC TGATCTCATC CGGCACGGAA 
TCCGAGCCCA AATGGGTGGC TTATTCTCAC AACGCGCTGG CGGGCGGACG AGGGCGATTT 
CTGCAACGAA TTCATCCCGA AGGAAAGACT TTCAGGGGTC TTTACCTGAT GCCGCTCGGC 
ACCGCATTCG GCTCCACGGC GACATTCGGG GTTTTATCCT GGCTGGGCGG CTCCCTCATT 
GTCCTGCGGC AATTTGACGT TGCAGCTGCT ATTCAAGCCC TCGCGGAACT GAAGCCCACG 
CATATATTGG GCGTTCCCAC GATGTTTCAA CGCATTGCCG CAGACCCTGC GTTGACGCAG 
GCGGATACGT CCAGCCTGGT TGCCATCATC AGCGGCGGCG CGAAAATCGA TGAAACCTCC 
ATTCGCCGAT GTACGAAGGC GTTCCGATGT GGATTCATCA GCTTGTATGG TTCTGCCGAT 
GGCGTCAATT GTCATACGAC CCTGGATGAT GACCTGGAAA CCATTATCAG GACGGCGGGA 
AGGCCCAATC CGGAAATCTG TTCCATTCGT ATAATCGATG ACCAGAAGCA GGAAGTACCG 
CAAGGTTGCA TAGGAGAAAT AGCGGCCAGG GGTCCGATAA GTCCCATGCA GTACGTCAAT 
GACCCGGATC TCGACGCCCT GTACCGTGAC CAGGAGGGAT GGGTGTATAC CGGTGACCTC 
GGCCTTATTG ATGAAGAGGG CCATCTGGTG CTATCCGGCC GCAAGAAAGA CATCATCATT 
CGGGGCGGCG TCAATATCAG TCCCGCTCAA ATTGAAAACA TTGCTGTTTC CCATCCGGCG 
GTTGTCAGCG CAGCCTGTGT TCCGGTGCCC GACGCGGACC TGGGACACAG GGTTTGCCTC 
TGTCTCGTCA CGAGAGAGGG AGCGGAACGT CCGTCACTTT CCCAGTTCAC CCGTTTTCTC 
CATGAAAAGG GCCTGGAGAC AAGCAAGCTT CCCGAATACC TGCGCTATTA CCGCCAGCTG 
CCCCTCAGCC CTGCGGGAAA AATCGATAAG AAGCGGCTGA CTACCGAAAT CGAATTCACG 
GAACATCCCG CCCACCGGAG TCATCCCGAA TGGGCACATT GA

Protein sequence

MNHSGILDMV PAEVRAQWAR QGIYPNKSLY ELFCERVEQQ PDNPAVISLD HTTSYAALLD 
KVHRLATSFQ ELGIVAGDVI SYQLHNDWRS CAIDLAAAAL GAIVAPFPPG RGRLDIQSLL 
RRCDARAIIV EREYGKTDLC ELIESIRPTL LSLRILVVDG AAGDGWHALD ELFRPASIEP 
DLPTVCPDSP ARFLISSGTE SEPKWVAYSH NALAGGRGRF LQRIHPEGKT FRGLYLMPLG 
TAFGSTATFG VLSWLGGSLI VLRQFDVAAA IQALAELKPT HILGVPTMFQ RIAADPALTQ 
ADTSSLVAII SGGAKIDETS IRRCTKAFRC GFISLYGSAD GVNCHTTLDD DLETIIRTAG 
RPNPEICSIR IIDDQKQEVP QGCIGEIAAR GPISPMQYVN DPDLDALYRD QEGWVYTGDL 
GLIDEEGHLV LSGRKKDIII RGGVNISPAQ IENIAVSHPA VVSAACVPVP DADLGHRVCL 
CLVTREGAER PSLSQFTRFL HEKGLETSKL PEYLRYYRQL PLSPAGKIDK KRLTTEIEFT 
EHPAHRSHPE WAH