Gene Syncc9605_1082 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9605_1082
Symbol
ID	3737794
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9605
Kingdom	Bacteria
Replicon accession	NC_007516
Strand	-
Start bp	1020343
End bp	1021533
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	59%
IMG OID	637775673
Product	agmatinase
Protein accession	YP_381394
Protein GI	78212615
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0010] Arginase/agmatinase/formimionoglutamate hydrolase, arginase family
TIGRFAM ID	[TIGR01229] arginase [TIGR01230] agmatinase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.193569
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATCCC CATCGGACCC TTCAGGGGCC TTCCAGCGTT CGTATCCCAG CGAAGGCATG 
CAGGCACTCG AGAAAGAACG CAAGCTTCCA CTCACTGGCT GGCAGCAAGA AGTTGACCAG 
GCCAAACGCT TCGGGCTTGA AGCCGCCGAA AGCATTGTTG ACCGCAACAT CTCCACCTTC 
TCTAGAGGCG AGCTGCCGCA TTTCGCCGGC ATCAACACCT TCATGAAGGC GCCCTATTTA 
GAAGATGTGA ACCAGGTGGG CAACTACGAC GTCGCCATCG TTGGTGTACC CCACGACTGC 
GGCACCACCT ACCGGCCCGG AACGCGCTTC GGCCCCCAGG GGATCCGACG AATATCAGCG 
CTTTACACCC CTTACAACTA CGAAATGGGT GTCGACCTGC GTGAACAGAT CACCCTCTGC 
GATGTGGGTG ACATCTTCAC GATCCCGGCC AACAACGAAA AGAGCTTCGA TCAGATCTCC 
AAAGGCATCG CCCACGTCTT CTCGAGCGGC ACCTTCCCGA TCATCCTCGG TGGCGACCAC 
TCGATCGGTT TCCCCACGGT GCGTGGGGTG TGTCGCCATC TCGGCGACAA AAAAGTGGGA 
ATCATCCATT TCGATCGCCA CGTCGACACC CAGGAGATCG ACCTTGATGA GCGGATGCAC 
ACCTGCCCTT GGTTCCATGC CACAAACATG GCCAACGCCC CGGCAGAAAA CCTGGTGCAG 
CTGGGCATTG GTGGTTGGCA AGTGCCTCGC GAGGGCGTCA AGGTCTGCAG GGAGCGGGGC 
ACCAATGTGC TCACGGTGAC CGACATCACT GAAATGGGGC TGGAAGCCGC AGCCCAATAC 
GCCATTGAAC GAGCCACCGA TGGCACGGAC TGCGTCTACA TCTCCTTCGA CATTGACTGC 
ATCGATGCCG GCTTCGTGCC GGGAACTGGC TGGCCTGAGC CCGGTGGCTT GATGCCGCGA 
GAAGCGCTCA AGCTGCTCGA GCTGATCGTG CGCAACGTTC CCGTCTGCGG CCTGGAAATC 
GTTGAGGTTT CACCTCCCTA CGACATCAGT GACATGACCT CCCTGATGGC CACCCGGGTT 
ATTTGCGACA CCATGGCCCA CCTTGTGGTG AGCGGTCAGT TACCCCGCAA AGAGAAGCCG 
GAGTGGATCA GCGACACCTG CAACATGAAC GTTGATCAGA AGTGGAGATA G

Protein sequence

MSSPSDPSGA FQRSYPSEGM QALEKERKLP LTGWQQEVDQ AKRFGLEAAE SIVDRNISTF 
SRGELPHFAG INTFMKAPYL EDVNQVGNYD VAIVGVPHDC GTTYRPGTRF GPQGIRRISA 
LYTPYNYEMG VDLREQITLC DVGDIFTIPA NNEKSFDQIS KGIAHVFSSG TFPIILGGDH 
SIGFPTVRGV CRHLGDKKVG IIHFDRHVDT QEIDLDERMH TCPWFHATNM ANAPAENLVQ 
LGIGGWQVPR EGVKVCRERG TNVLTVTDIT EMGLEAAAQY AIERATDGTD CVYISFDIDC 
IDAGFVPGTG WPEPGGLMPR EALKLLELIV RNVPVCGLEI VEVSPPYDIS DMTSLMATRV 
ICDTMAHLVV SGQLPRKEKP EWISDTCNMN VDQKWR