Gene Syncc9902_2044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9902_2044
Symbol
ID	3743004
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9902
Kingdom	Bacteria
Replicon accession	NC_007513
Strand	-
Start bp	1953168
End bp	1954340
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	57%
IMG OID	637772241
Product	ATP-sulfurylase
Protein accession	YP_378045
Protein GI	78185611
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2046] ATP sulfurylase (sulfate adenylyltransferase)
TIGRFAM ID	[TIGR00339] ATP sulphurylase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGCCA GTGCTTCTGC CTCAGCCAAG AGATCCGGAG TGATCGCTCC CTATGGCGGC 
ACGCTGGTGG ATCTCATGGT GCCGAGCGCG GATCAACCTG CGTTGAAGGC ATCAGCTACC 
AAAACGTTGG AATGCTCAGA CCGCAACGCC TGTGACGTGG AATTGCTGGT GGTCGGAGGG 
TTTTCCCCTT TACGCGGCTT TATGCACCAG GAGGACTACG ACGCTGTTGT GTCCGGTCAT 
CGCACGTCAG CAGGCCATTT ATTCGGTTTG CCAATCGTGA TGGACACCGA TCGCGACGAC 
GTGGTGGTGG GAGACAAACT CTTGCTGACT TACAAGGGGC AAGAGCTTGC TCTTCTCGAG 
GTTGAGGACA AGTGGGAACC CAACAAGGTG GTTGAGGCCC AGGGGTGTTA CGGCACGACA 
TCGCTTGAAC ACCCCGCTGT GCGCATGATC GCGATGGAAC GCAAATGCTT CTATCTAGGC 
GGCACGCTGA AGGGTTTGGA GCTGCCAAGC CGCGTTTTCC CCTGCAAAAC CCCGGCCGAA 
GTTCGTTCTG ATTTGCCCCA TGGCGAAGAC GTGGTGGCCT TCCAATGCCG TAACCCCATT 
CACCGCGCCC ACTACGAACT GTTTACCCGG GCTCTACATG CCCAAAATGT GAGCGAGAAC 
GCCGTGGTGT TAGTGCACCC CACCTGTGGA CCAACCCAGC AGGACGACAT CCCAGGGTCG 
GTTCGTTTTG AGACCTACGA GCGCTTGGCG GCCGAGGTGA ACAATGATCG AATTCGGTGG 
GCTTATCTCC CCTATGCCAT GCACATGGCA GGGCCACGGG AAGCCCTCCA GCACATGATT 
ATTCGCAGGA ATTATGGGTG CACCCATTTC ATCATTGGCC GCGATATGGC GGGTTGTAAG 
TCCTCTCTGA CTGGCGACGA TTTTTACGGC CCCTATGACG CTCAGAACTT TGCGAAGGAG 
TGTGCACCAG AGCTCACCAT GGAGACGGTG CCTTCTCTGA ATCTTGTTTA CACGCAGGAG 
GAGGGCTACG TCACCGCTGA ACATGCGGAA GCGCGTGGAC TCCATGTGAA AAAGCTCAGC 
GGCACACAGT TCCGCAAGAT GCTGCGTGGT GGTGAGGAGA TTCCTGAGTG GTTTGCCTTC 
AAGAGCGTCG TTGAGGTGCT CCGTTCCTCA TGA

Protein sequence

MTASASASAK RSGVIAPYGG TLVDLMVPSA DQPALKASAT KTLECSDRNA CDVELLVVGG 
FSPLRGFMHQ EDYDAVVSGH RTSAGHLFGL PIVMDTDRDD VVVGDKLLLT YKGQELALLE 
VEDKWEPNKV VEAQGCYGTT SLEHPAVRMI AMERKCFYLG GTLKGLELPS RVFPCKTPAE 
VRSDLPHGED VVAFQCRNPI HRAHYELFTR ALHAQNVSEN AVVLVHPTCG PTQQDDIPGS 
VRFETYERLA AEVNNDRIRW AYLPYAMHMA GPREALQHMI IRRNYGCTHF IIGRDMAGCK 
SSLTGDDFYG PYDAQNFAKE CAPELTMETV PSLNLVYTQE EGYVTAEHAE ARGLHVKKLS 
GTQFRKMLRG GEEIPEWFAF KSVVEVLRSS