Gene Syncc9605_2075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9605_2075
Symbol
ID	3735806
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9605
Kingdom	Bacteria
Replicon accession	NC_007516
Strand	+
Start bp	1897990
End bp	1899189
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	61%
IMG OID	637776661
Product	putative arylsulfatase regulatory protein
Protein accession	YP_382370
Protein GI	78213591
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCGTTT CCTCTCCCAA CGTCGGGCCC GACCTCAACC GGTTCGGGCC CATCGGCCTC 
GTGGTGGTGC AGTCCACTTC GCTGTGCAAC CTCGATTGTT CGTATTGCTA TCTGCCGGAC 
CGGCAGAAGA AGCGGGTCTT TGACCTGGAT CTGCTGCCCC TGCTGATGCA GCGGATTCTG 
GAAAGCCCCT ATGCCGGCCC TGAATTTTCC CTGGTTTGGC ATGCCGGTGA ACCACTCACC 
CTGCCCACCA GTTGGTACGA CGAGGCGACG TCGATCCTGT ATCGCAGCCT TGATCAGTTC 
AATGCGCAGG GGCTGGATTT CACCCAGCAC GTGCAAACCA ACGCCACGTT GATCAACGAC 
GCGTGGTGCG ACTGCTTCCG GCGCAACCGC ATCGTGGTGG GCATCAGTGT GGATGGCCCT 
GAGGACATCC ACGACGCCCA CCGGCGCTTC CGCAACGGGC GCGGTTCCCA TGCCATGGCG 
ATGAAGGGAA TTGAAGCCCT GCATCGCAAC GATGTGCCCT TCCACTGCAT CTCGGTGGTG 
ACCGCCGATG CCATGGAGCA ACCGGAGCGG ATGTATAGCT TCTTCCGCGA CAACGGCATC 
ACCGATGTGG GCTTCAACGT TGAGGAGCAG GAGGGGATCA ACACGAGCTC CTCAATGCAG 
GGGTCCGCAA TGGAGGAGAA ATACCGCAAC TTCCTGCGGG CCTTCTGGCG GCTGAGCGAG 
CAAGACGGCT ATCCCGTGGT GCTGCGCGAA TTCGAGCAGG TGATCAGCCT GATCCAAGGC 
AATGCGCGGA TGACCCAGAA CGAGCTGAAT CGCCCGTTCT CGATCCTCAG CGTCGATTGG 
GAGGGCAATT TCTCCACCTT CGACCCCGAG CTGCTTTCGG TAGCCAGTGA CCGCTACGGC 
AGCTTCAACC TCGGCAATCT CAAGGATCTG TCGCTGGTGG AGTCCACCCA CACCGAGCAG 
TTCCGTTGGC TGATGGCCGA CATGAGCAGC GGCGTGGAGA CCTGCCACAA GGGCTGCGAG 
TACTTCGGCC TCTGTGGCGG GGGCAACGGC AGCAACAAGT TCTGGGAACA CGGCACCCTC 
GCCTCCAGCG AAACCAACGC CTGCCGCTTC GGGACCCAGA TCCCGACGCA AGTGCTGTTG 
GAGCGCTTTG AAGAAGGTCC GCCGCTGACT CCCCTCACAC CCAATCCATC AGATTCTTAA

Protein sequence

MIVSSPNVGP DLNRFGPIGL VVVQSTSLCN LDCSYCYLPD RQKKRVFDLD LLPLLMQRIL 
ESPYAGPEFS LVWHAGEPLT LPTSWYDEAT SILYRSLDQF NAQGLDFTQH VQTNATLIND 
AWCDCFRRNR IVVGISVDGP EDIHDAHRRF RNGRGSHAMA MKGIEALHRN DVPFHCISVV 
TADAMEQPER MYSFFRDNGI TDVGFNVEEQ EGINTSSSMQ GSAMEEKYRN FLRAFWRLSE 
QDGYPVVLRE FEQVISLIQG NARMTQNELN RPFSILSVDW EGNFSTFDPE LLSVASDRYG 
SFNLGNLKDL SLVESTHTEQ FRWLMADMSS GVETCHKGCE YFGLCGGGNG SNKFWEHGTL 
ASSETNACRF GTQIPTQVLL ERFEEGPPLT PLTPNPSDS