Gene Syncc9902_1920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9902_1920
Symbol
ID	3743800
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9902
Kingdom	Bacteria
Replicon accession	NC_007513
Strand	+
Start bp	1835202
End bp	1836410
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	58%
IMG OID	637772115
Product	hypothetical protein
Protein accession	YP_377921
Protein GI	78185486
COG category	[S] Function unknown
COG ID	[COG4370] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03492] conserved hypothetical protein

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00171582
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATCTGCA ACGGCCACGG AGAAGATTTC ATCGCCCTAC GCGTTCTGGA AGCGGTTCAT 
CGCCGGCATC CTCAACTTCC CTTAGAAGTA ATGCCTCTGG TGGGCCAAGG ACGAGCTTTT 
GCAGACGCGG TGAGGGCTGG TTGGCTGCAA CGGATTGGTC CAACAGCGAC TCTGCCAAGT 
GGAGGATTTA GCAATCAAAG TCTGCGGGGA CTACTCCGAG ATCTTCGAGC GGGGTTACCC 
CTCTTGAGCT GGGGGCAATG GCGACTTGTT CAACGGCGGG CTCATCAAGG ACGCTTTCTT 
GTGGCCGTTG GCGATCTATT GCCGCTGCTG ATGGCCTGGG CCAGTGGCGC TGGCTTCGGA 
TTCATTGGGA CGCCAAAAAG TGATTACACC TGGCGAAGCG GTCCTGGTCG AAACCTGAGC 
GATCGATATC ACCGCCTGAA GGGCAGTGAA TGGGATCCCT GGGAATGGAT CTTGATGCGC 
TCCAAACGGT GCCAATGGGT CGCGATGCGA GATCAACTCA CAGCCCGAGG ACTCCGTCGC 
CATCGGGTGG CTGCTCAAGC GCCCGGTAAT CCAATGATGG ATGGCCTCCA ACGCAAGACG 
ATTCCGAAAG CACTCGAGCG TTGCCGAAGA GTGCTTGTGT TGTGTGGGAG CCGAATGCCT 
GAAGCCCAGG CCAACTTCGA TCGTCTGTTG AAGGCGATCG GCCTTGTGCA ATCCGCGGTA 
CCGATGGGCT TCCTTGTTGC AGCGGGAGCC GAGCCCTCAC CGGAAGGGTT TCGAAGAAGT 
TTGGAACAAC AGGGCTTCAG GCGAAGTTTG CCTCCATCCG ATCAACTCAA CGCAGAAAGC 
TGTTGGGTAA AAGGCCCCTG CATGCTGCTC ATTGGACGAT CCTGTTTTGA CAGTTGGAGC 
GGCTGGTCTG AAGTGGGCCT TGCCACGGCT GGAACAGCCA CAGAACAGCT TGTAGGCCTT 
GGCATTCCAG CCCTCTCGTT ACCGGGTCCT GGCCCCCAGT TCAAGGCAAG TTTTGCGCGC 
AGGCAAAGCC GATTGCTTGG AGGCTCAGTC GAGCCTTGTT CATCACCGAT TGCGCTGGCA 
ACGGCACTCG AACGCCTGCT GGCAGACGCA GATTTACGGA GGAGGCTGGG GCAGATTGGC 
CAACGACGCA TGGGAGCATC AGGGGGCAGC GATCGGCTCG CCAAGCTGAT CCTTGACCAC 
CTGCACTGA

Protein sequence

MICNGHGEDF IALRVLEAVH RRHPQLPLEV MPLVGQGRAF ADAVRAGWLQ RIGPTATLPS 
GGFSNQSLRG LLRDLRAGLP LLSWGQWRLV QRRAHQGRFL VAVGDLLPLL MAWASGAGFG 
FIGTPKSDYT WRSGPGRNLS DRYHRLKGSE WDPWEWILMR SKRCQWVAMR DQLTARGLRR 
HRVAAQAPGN PMMDGLQRKT IPKALERCRR VLVLCGSRMP EAQANFDRLL KAIGLVQSAV 
PMGFLVAAGA EPSPEGFRRS LEQQGFRRSL PPSDQLNAES CWVKGPCMLL IGRSCFDSWS 
GWSEVGLATA GTATEQLVGL GIPALSLPGP GPQFKASFAR RQSRLLGGSV EPCSSPIALA 
TALERLLADA DLRRRLGQIG QRRMGASGGS DRLAKLILDH LH