Gene Nmul_A1900 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1900
Symbol
ID	3784272
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2187707
End bp	2188753
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	56%
IMG OID	637811986
Product	cyanophycinase-like protein
Protein accession	YP_412587
Protein GI	82703021
COG category	[P] Inorganic ion transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4242] Cyanophycinase and related exopeptidases
TIGRFAM ID	[TIGR02069] cyanophycinase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.147675
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATACCG GAGATTGTGC CAATAAATCC TTCCCGCGGC TTTTTGCACA CCTTGCCCTG 
GCCTCTGCGG TGGTCTTCAT GACCTTCGGG GTTCTGGCAG AGCCCAAGCC CAAAGGCTAC 
GAATATTACC TTACGGGCAA CGCGGTTGAT GCTGTCCTGC CGCAAAGGCC ACCATCGCCA 
TCAACTCTCC TGATGGGCGG AGGTCCCGAT GTGGACGCTG CATTCAAGTG GATGATCCAG 
AAGGCGGGAG GCGGCGACTT TGTGGTGATC CGTGTACGGG GAGCCGACGG CTACAACCAG 
TATGTCTACG ACATGGGCGG TATAGATTCC ATCGAGACAC TGGTCATAAA GACGCGTGAG 
GCCGCCAGCG ATCCGTTCGT GCTCGATCGG ATCAAAAAAG CGGAAATTTT GTTTATCGCG 
GGCGGCGACC AGAGTGATTA CATTAATCTC TGGAAAGGAA CTGCGCTCGA AACGGCGATT 
AATGAACTGA TTGGTCGCAA TGCACCTATC GGGGGCACCA GCGCGGGACT TGCAGTTCTG 
GGTCAGTTTG ACTTCGTAGC GTTGAACGGC ACGGTGTACT CTGACGATGC GCTGGCCGAT 
CCTTATAACC GTCGCATGAC TCTCGATCGA GAATTTCTGA CTGCGCCTGG CTTGAATGGG 
GTAATTGCCG ATGCGCATCT CGACACGCGC GACCGGATGG GACGCCTTCT CACCTTTCTC 
GCCCGTACCA TCCAGGACCA ATGGGTGAGC GTTGAATCCG CCCGAGGCAT TGGTCTGGAT 
GTCGAAACCG CGTTGGCGAT TGACAATGGC ATTGCAATCC GCCTGGGTGT CGGCTCGGCA 
TATTTTCTAA GGCCCACAAT TGCCCCAACC GTCTGTCAAA GCGGCCAGCC TCTGACTTTC 
CGCAATGTCA TGGTAGACAG ACTCTCGGGA TCGGGATCAT TCCATCTCGG CCAGTGGACG 
AGTCCGGGAA ATGGCACAAC CCGGTATGAC CTTTCAGCTG AAACCGGGGT GTTGGTCTCG 
TCTCAGCTGG GGGGTGGAAT CTATTGA

Protein sequence

MDTGDCANKS FPRLFAHLAL ASAVVFMTFG VLAEPKPKGY EYYLTGNAVD AVLPQRPPSP 
STLLMGGGPD VDAAFKWMIQ KAGGGDFVVI RVRGADGYNQ YVYDMGGIDS IETLVIKTRE 
AASDPFVLDR IKKAEILFIA GGDQSDYINL WKGTALETAI NELIGRNAPI GGTSAGLAVL 
GQFDFVALNG TVYSDDALAD PYNRRMTLDR EFLTAPGLNG VIADAHLDTR DRMGRLLTFL 
ARTIQDQWVS VESARGIGLD VETALAIDNG IAIRLGVGSA YFLRPTIAPT VCQSGQPLTF 
RNVMVDRLSG SGSFHLGQWT SPGNGTTRYD LSAETGVLVS SQLGGGIY