Gene Synpcc7942_2053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Synpcc7942_2053
Symbol
ID	3774272
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus elongatus PCC 7942
Kingdom	Bacteria
Replicon accession	NC_007604
Strand	+
Start bp	2130328
End bp	2132259
Gene Length	1932 bp
Protein Length	643 aa
Translation table	11
GC content	60%
IMG OID	637800498
Product	peptidase
Protein accession	YP_401070
Protein GI	81300862
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1506] Dipeptidyl aminopeptidases/acylaminoacyl-peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.58101
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCACGG CTGCCTACGG TTCTTGGCGA TCGCCGATCA GTGCCGACCT GATTGTGCAA 
GGCAGTGTTG GATTGAGCGG TGTGATGCTG TCAGGGGGCG ATCGCTACTG GCTGGAGTCG 
CGCCCCACGG AACGCGGCCG TACGACATTG ATTCGCCAAT CCGCGACAGG ACAGATTGAA 
GAACTAACTC CGACACCGTG GAACGTTCGC ACTCGAGCCC ATGAGTATGG CGGCGGCTCC 
TACTGCATCG ATCAGGGCGA GGTCTACTTC AGCCACGACA AGGATCAGCG GCTCTATCGC 
CTGATTCTGG GGCAAGATCC GCAGCCGTTG ACGCCGGAGC TACCGCTGAA ATTTGCAGAT 
GGTCTGATCG ATCGCCAGCG GCAGCGCTGG ATTGGCGTCC GCGAAGATCA CCGACCGGAG 
GGCGAAGCGA TCGATGCGAT CGTGGCGATT CCTCTGACTG GCGAACCCAG TGAAGGGCAG 
ATTCTCACGA TCGGAGCGGA CTTCTATGCA TCGCCGCGCC TCAGTGCCGA TGGGCAACGG 
CTGGCTTGGC TGACTTGGTC GCACCCGAAT ATGCCCTGGG ATGGCACCGA GTTGTGGGTG 
GCGGAGTTCC TAGCCGATGG GTCGCTGGCC ACGCCGCAGA AAGTTGCAGG AGGCGATCGC 
GAGTCGGTGT TTCAGCCGGA ATGGCTGCCG GATGGGCGTT TGGGCTTTGT CTCCGATCGC 
AGCAGCTGGT GGAATCTCTA CAGCTGGGAT GGTCAGAACA CGCAGGCGAT CGCGCCCACT 
GAGGCGGAAT TTGGCCTGCC CCAATGGGTG TTTGGTATGC GCACTTGGGC ACCGATCGAT 
GGCGATCGCT GGTTGGCCGC TTCTACAAAG GCAGGGCACT GGTCGCTCTC GCTAGTGGAT 
CTCGCCACGG GCAGCCTGAA GCCATTTGAT CTGCCGTTCA CGGATATCTC TGGCTTAGTT 
GTAGAAGGCG ATCGCGCTTT ATTTACGGCA GCCAATACCG ATCGCCCGGG TGCGGTGATT 
GAACTGCAAA TCAGCAGTGG CGAGTGGCAA GTCCTCAAGT CCAGCTCCAG CTTGGATCTC 
GACCCGCGCT ATCTCTCGAT TCCCCAGAGC ATTAGTTTCC CGAGTGCCAA TGGTCGGGTG 
GCATACGGTC ACTTCTACCC GCCGAATAAT CCGGACTACC GAGCGCCTGC GGGCGAGAAA 
CCGCCGCTAC TGGTCAAAAG TCATGGCGGC CCGACGGCGC AAACTCGCAG CAGCCTTAGC 
CTTGGCATTC AGTACTGGAC GAGTCGCGGT ATCGCTGTGC TTGATGTCGA TTACGGCGGT 
AGCACGGGCT ATGGCCGCCC CTATCGCGAT GCCCTGCAAG GGCAGTGGGG CATTGTCGAT 
GTTGAAGATT GCGCCGCTGG TGCCCAGTGG TTAGCCGATC AAGGGCTAGT GGATGGCGAT 
CGCCTCTGCA TTGATGGTGG TAGCGCGGGC GGCTACACAA CGCTCTGTGC CCTGACCTTC 
ACCGATGTTT TCAAAGCCGG AGCGAGCCGC TATGGCATTG GCGACCTCAA AGCCCTCGCT 
GAAGACACCC ACAAATTTGA GTCCCGCTAC CTCGATGGCT TGATTGGCCC TTGGCCCGAG 
GCGGCGGATC TTTACCGCGA GCGATCGCCG ATTCACCACG TCGAGCAGCT CAACTGCCCT 
GTGATTTTCT TCCAAGGTTT GGAAGACAAA GTTGTGCCAC CGGCGCAGGC AGAAACCATG 
GTCGCCGCAC TCAAAGCCAA AGGCCTGCCT GTCGCCTATG TGCTCTTCCC CGAGGAACAG 
CACGGCTTCC GGCAGGCTGC TAACATCAAG CGATCGCTGG AAGGGGAGCT GTACTTCTAC 
AGCCAAATCT TCGGCTTCGA CCTTGCAGAC GAAATCGAAC CGGTGGCGAT CGCTAACTGG 
CCTAAGGCTT AA

Protein sequence

MITAAYGSWR SPISADLIVQ GSVGLSGVML SGGDRYWLES RPTERGRTTL IRQSATGQIE 
ELTPTPWNVR TRAHEYGGGS YCIDQGEVYF SHDKDQRLYR LILGQDPQPL TPELPLKFAD 
GLIDRQRQRW IGVREDHRPE GEAIDAIVAI PLTGEPSEGQ ILTIGADFYA SPRLSADGQR 
LAWLTWSHPN MPWDGTELWV AEFLADGSLA TPQKVAGGDR ESVFQPEWLP DGRLGFVSDR 
SSWWNLYSWD GQNTQAIAPT EAEFGLPQWV FGMRTWAPID GDRWLAASTK AGHWSLSLVD 
LATGSLKPFD LPFTDISGLV VEGDRALFTA ANTDRPGAVI ELQISSGEWQ VLKSSSSLDL 
DPRYLSIPQS ISFPSANGRV AYGHFYPPNN PDYRAPAGEK PPLLVKSHGG PTAQTRSSLS 
LGIQYWTSRG IAVLDVDYGG STGYGRPYRD ALQGQWGIVD VEDCAAGAQW LADQGLVDGD 
RLCIDGGSAG GYTTLCALTF TDVFKAGASR YGIGDLKALA EDTHKFESRY LDGLIGPWPE 
AADLYRERSP IHHVEQLNCP VIFFQGLEDK VVPPAQAETM VAALKAKGLP VAYVLFPEEQ 
HGFRQAANIK RSLEGELYFY SQIFGFDLAD EIEPVAIANW PKA