Gene Nmul_A1689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1689
Symbol
ID	3784615
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1929024
End bp	1930148
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	51%
IMG OID	637811775
Product	cyanophycinase-like protein
Protein accession	YP_412379
Protein GI	82702813
COG category	[P] Inorganic ion transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4242] Cyanophycinase and related exopeptidases
TIGRFAM ID	[TIGR02069] cyanophycinase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATTAC TTGTGTGGTT TTTTCTCGCT CAGCAGCAAA CAAACTCCAG AATTATATGC 
AGATGGATGG CAACCCCAAT CGTGGTTGCT GTGTTTTCGA CAGGGATAGG CTTGGTAGAG 
GCAGCCAATA AATCGCGCTT AGGGATCTCT CTAAATGGCG AGCCGGTCGA TTACCTGCCC 
TGCGGCACAA TTCCGTTAAG CACGCGAACT GCTGTATTAA TGGGTGGAGG AGACGACGTC 
AAGGAGGCCT TCAGCTGGAT GATTGCCAAG ATGAGCCAAT GTGGCGATGG CAATACAGGG 
AGGCCGGGAA ATTTTGTCGT GATTGATAAT GGCAGCGTCC CGCCTGACGA TACTTACATC 
AGCATAGTCG GGCCCGTCGC CTCGGTAGTA ACTCTGGTTG TTCCTGACAT AGAAACAGCT 
AATGACCCCG CCCTCGAGCC TTACATTCGA AATGCCGGCG CAATCTGGCT AACCGGGGGC 
GATCAAGGGC GCTACTACAA TTTCTGGAAG GACTCGTTGC TGGAACAACT GATATCAAAG 
CAGGTCCGGA ATTTCAAGAT TCCCATTGGC GGAACAAGCG CGGGAACCAT GGTACTCAGC 
GAGTTCGCTT ATGTCGCCGA CCCGTGCGCG ATCACTTCGT CAAAAGCCTT GACCGACCCC 
TACTCACAGT GCGTAGCACT GAGACGTGAT TTTTGGAGCG ACAGGACGCC TTTACCCCCC 
CTGTTATCGA CTGTCACTGA TTCCCATTTC AATGCGCGCG ATCGCATGGG CCGCCTGATC 
ACGTTCCTGG GGCACGCGAT AAATAGCCAA TGGACCAGTG CTGCCATTGC CCAGGCTATC 
GGAGTAGATG AGGAAACAGC ATTATTGATG GAAATTGATG ACAATACAGA CCCATCTTCT 
CCCGGCACCA ATTTTAGTTA CAAGGTCATT ACAAATACAG GAGTCAGCGG GTCAGTCTAT 
ATTCTCAGCA CCGATTCGCA AAGTCAGCTG AACCTTGAGC CCGACCAGCC TCTTAGCTTT 
ACCAATGTAA AAGTGAGAAA GATAGAGACT GCGGGAAATG AGAGTGATTA TATTATCGAC 
GTCAAGGAAG GCGATTTAAT ATCCAGCACT GGCAGCATTT ACTGA

Protein sequence

MELLVWFFLA QQQTNSRIIC RWMATPIVVA VFSTGIGLVE AANKSRLGIS LNGEPVDYLP 
CGTIPLSTRT AVLMGGGDDV KEAFSWMIAK MSQCGDGNTG RPGNFVVIDN GSVPPDDTYI 
SIVGPVASVV TLVVPDIETA NDPALEPYIR NAGAIWLTGG DQGRYYNFWK DSLLEQLISK 
QVRNFKIPIG GTSAGTMVLS EFAYVADPCA ITSSKALTDP YSQCVALRRD FWSDRTPLPP 
LLSTVTDSHF NARDRMGRLI TFLGHAINSQ WTSAAIAQAI GVDEETALLM EIDDNTDPSS 
PGTNFSYKVI TNTGVSGSVY ILSTDSQSQL NLEPDQPLSF TNVKVRKIET AGNESDYIID 
VKEGDLISST GSIY