Gene Synpcc7942_2595 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Synpcc7942_2595
Symbol
ID	3775192
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus elongatus PCC 7942
Kingdom	Bacteria
Replicon accession	NC_007604
Strand	+
Start bp	2677378
End bp	2678808
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	56%
IMG OID	637801049
Product	hypothetical protein
Protein accession	YP_401612
Protein GI	81301404
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCCTC TGCCTGCCCC TACCCCTGAC TTGACTGCCG CGATCGCCGC AAGCCCCGAT 
CTACCACTGA GCGCTTGGCT CTGGCGGGGA GCTGCGATCG TGCTGCTAAT TGTCATCAAT 
GCCTTCTTTG TGACTGCGGA GTTTGCGATC GTCTACGTCC GGCGATCGCG GATTAATCAA 
CTCGCCCAGG AAGGCGACGT TCCCGCTCGC ATGGTGGAAC GACTACAGCG CAGCATTGAT 
CGACTGCTCT CGACCACACA GCTAGGAATT ACGCTGGCGA GTTTAGCCCT CGGCTGGGTC 
GGAGAATCAA CGATCGCCGT TCTGATTCGT CAGGCACTCG AGCAACTGCC GCTACCCGCG 
ATCGGGCCAG AACCGCTCAG CCATGTCCTG GCGATCCCCC TCGCCTTTGC CCTGCTGGTC 
TATCTCCAGA TCGTCCTAGG TGAACTCTGT CCCAAGGCAG TCGCACTGAT CTACCCAGAA 
CAGATGGCCC GCCTCTTAGG TCCACCAAGC ATTGCGATCG CCCAGATTTT TGCGCCGGTG 
ATCAGCCTAT TGAACGGCTC GACCCGATGC CTGCTGGGAC TCTTCGGCAT CGACTATAGC 
CAGCAGCGCT GGTATAGCAG CGTCACCCCA GAGGAGCTGC AGTGGATCAT TCAATCTGCA 
GCTGAATCGA CAGGCTTAGA AGCAGAAGAA CGGCAGATTC TCAGTAATGT GATTGAGTTT 
GGTGAAATCA CCGCTGGCGA AGTGATGGTG CCACGCACCC GGATTGTGGC GCTAGAAGAA 
GACGCCACCT TCCTCGATCT TTTGGCTGCG ATTCAGGAAT CCGGCCATGC TTGCTTTCCC 
GTGATCAGAG ACAGCCTTGA CCAAGTCTTA GGCCTGATCG ACTTTCGTGC TTTGGCGGTG 
CCGATGGCCA GCGGCGAACT TCAGCCCAGC AGTCCTGTCA AAGCCTGGGT GCAACCAGCC 
CGTTTTGTCC CGGAAGGCCT CTCCCTAAAA GAGTTACTGC CCCAGATGCA GCGATCGCCC 
CTACCGATGG CGATTGTGGT CGATGAGTTT GGCGGCACCG AAGGTCTGGT GACCTTGCAG 
GACATTCTGG CGGAAATTCT CGGCGATGAA GAGCAAGACG CTGAGGAGAA TGAACAGTTT 
CGGCGGATTG ACGACCAAAC CGTGCTGGTT CAGGCTCAAA CGGACATTGA GACCGTCAAT 
GAGCGCTTAG GACTGGATCT TCCCCTCGAA GAGGAGTACA ACACCTTGGG TGGATTTGTC 
GTAGCGCAGT TACAGAAAAT TCCCGAAGCC GGTGAAGGCT TTGACTTTCA GGATTGTCAG 
ATTCGCGTGG CGATCGCAGA AGGGCCACGG TTGGAATTTA TCGAAATTCG ACAATTGCGA 
TCGCCGCAAC CTGCAGCGTC CGATGAGGCA AAACCGCATG CTAACATCTG A

Protein sequence

MDPLPAPTPD LTAAIAASPD LPLSAWLWRG AAIVLLIVIN AFFVTAEFAI VYVRRSRINQ 
LAQEGDVPAR MVERLQRSID RLLSTTQLGI TLASLALGWV GESTIAVLIR QALEQLPLPA 
IGPEPLSHVL AIPLAFALLV YLQIVLGELC PKAVALIYPE QMARLLGPPS IAIAQIFAPV 
ISLLNGSTRC LLGLFGIDYS QQRWYSSVTP EELQWIIQSA AESTGLEAEE RQILSNVIEF 
GEITAGEVMV PRTRIVALEE DATFLDLLAA IQESGHACFP VIRDSLDQVL GLIDFRALAV 
PMASGELQPS SPVKAWVQPA RFVPEGLSLK ELLPQMQRSP LPMAIVVDEF GGTEGLVTLQ 
DILAEILGDE EQDAEENEQF RRIDDQTVLV QAQTDIETVN ERLGLDLPLE EEYNTLGGFV 
VAQLQKIPEA GEGFDFQDCQ IRVAIAEGPR LEFIEIRQLR SPQPAASDEA KPHANI