Gene Syncc9902_1847 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9902_1847
Symbol
ID	3742140
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9902
Kingdom	Bacteria
Replicon accession	NC_007513
Strand	+
Start bp	1779445
End bp	1780902
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	53%
IMG OID	637772042
Product	putative neutral invertase-like protein
Protein accession	YP_377848
Protein GI	78185413
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.570169
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGGACGC GATTTACAGA AGAGAGTCAG CGATTTCGTC CCAGTTCCAA AGAAGACCAA 
GTGGTCCAAA AGGCCCAAGA GCACTTCGAA CGCACCCTCA TATCGATTCA GGGACAACTC 
GCCGGAAGCG TTGCAGCTCT TGAAAGTAGT TACGCCGATT CGGAGCTGAA CTACGGCGAA 
ATCTTTGTCC GAGACAACGT CCCGGTGATG ATTTATTTGC TGGTACAGGG ACGCTTCGCG 
ATCGTGAAGC AATTTCTGAA GGTTTGCCTC GACCTCCAGA GCACGAGTGT CCAAACCCGT 
GGGGTTTTTC CGACAAGTTT CGTTGAAGAA GAGGGGAATC TGGTTGCTGA TTACGGCCAG 
CGCTCTATTG GGCGGATCAC CTCTGTGGAT CCAAGCCTGT GGTGGCCGAT CCTTTGTTGG 
ATTTACGTCA AAAGAAGTGG CGACACTGAT TTTGGGCGGA GCCCAGAAGT GCAGCGCGGA 
ATCCAACTCC TTCTTGATCT GGTACTGCAC CCCAGCTTTG AAGGAACACC TGTGCTGTTC 
GTACCGGACT GCGCCTTCAT GATCGATCGT CCGATGGACG TTTGGGGCGC ACCACTGGAA 
GTGGAAGTGT TGTTGTACGG CGCACTACGA AGCTGCGTTG AACTCATGGA GCTTTGCCAA 
CGCCACGACA CCAGCGCACT CCTGGCAGAG CGTCTCCGCC TAAGTCGCAA ATGGACCCAT 
GACCTGCGGC AATTTCTGTT GAAGCACTAC TGGGTCACCA GCAAAACCAT GCAGGTTCTC 
CGGCGTCGTC CCACGGAGCA ATACGGAGAC AACCAGCACC AAAACGAATT CAATGTTCAA 
CCTCAGGTGA TCCCTGATTG GCTTCAGGAC TGGCTTCAAG ATCGAGGTGG ATACCTCATC 
GGCAACATTC GAACTGGCAG GCCGGACTTC CGTTTCTACA GCCTGGGCAA TTCGCTCGCC 
TCGATGTTTG GACTGCTCAC GGCACCACAA CAACGGGCCT TATTTCGGCT GGTGCATCAC 
AACCGTGATC ACCTCATGGC ACAAATGCCA ATGCGAATCT GCCATCCCCC AATGGCAGGG 
GTGGAGTGGG AAAACAAAAC GGGGTCCGAC CCTAAAAACT GGCCTTGGAG TTATCACAAC 
GGTGGGCATT GGCCCAGCCT GCTTTGGTTT TTTGGATCAT CAATCCTTCT CCATGAACGG 
CTGCATCCCA ATGCTGACGT GTTGTTAATG AGTGAAATGA CCACACTCCT CGACGAGTGC 
TACTGGAGCC ATCTCAACCA ACTCCCGCGG CAACAGTGGG CTGAATATTT CGATGGGCCA 
ACGGGAACAT GGGTGGGACA ACAATCAAGG ACATTTCAAA CCTGGACCAT CGTGGGGTTC 
CTCTTAACCC ACCATTTCCT CCGAGTGAAT CCCGATGACG TCTTAATGCT GAATCTGGAT 
GCTGGCCTCG GCCGCTAA

Protein sequence

MGTRFTEESQ RFRPSSKEDQ VVQKAQEHFE RTLISIQGQL AGSVAALESS YADSELNYGE 
IFVRDNVPVM IYLLVQGRFA IVKQFLKVCL DLQSTSVQTR GVFPTSFVEE EGNLVADYGQ 
RSIGRITSVD PSLWWPILCW IYVKRSGDTD FGRSPEVQRG IQLLLDLVLH PSFEGTPVLF 
VPDCAFMIDR PMDVWGAPLE VEVLLYGALR SCVELMELCQ RHDTSALLAE RLRLSRKWTH 
DLRQFLLKHY WVTSKTMQVL RRRPTEQYGD NQHQNEFNVQ PQVIPDWLQD WLQDRGGYLI 
GNIRTGRPDF RFYSLGNSLA SMFGLLTAPQ QRALFRLVHH NRDHLMAQMP MRICHPPMAG 
VEWENKTGSD PKNWPWSYHN GGHWPSLLWF FGSSILLHER LHPNADVLLM SEMTTLLDEC 
YWSHLNQLPR QQWAEYFDGP TGTWVGQQSR TFQTWTIVGF LLTHHFLRVN PDDVLMLNLD 
AGLGR