Gene Cyan8802_4307 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_4307
Symbol
ID	8393659
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	-
Start bp	4446734
End bp	4448800
Gene Length	2067 bp
Protein Length	688 aa
Translation table	11
GC content	36%
IMG OID	644982217
Product	Prolyl oligopeptidase
Protein accession	YP_003139928
Protein GI	257062040
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1505] Serine proteases of the peptidase family S9A
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.17426
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0613524
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATCTT ATTTTTCTAA ATTTTCCTAT CCTTTGAGTC AACAACAAGA TATTATTGAT 
ATTTATCATG GAATAACTGT TAAAGATCCC TATCGTTGGT TAGAAAATCC TGACTCCGAA 
GAAACTCAAA CTTGGATCAA GGCACAAAAT CAACTAACTT TTGATTATTT AGCCAATATT 
TCTGTTAGAG AACCTCTTAA AAAACGGCTA ACTGAACTGT GGAATTATGA AAAGTATGGT 
ATTCCTTTTA AAGAAGGCGA TCGCTACTTT TATTTTAAAA ATGATGGACT GCAAAATCAA 
AGCGTTTTCT ACACTTTAAA AACCCTTAAA GACGAACCCC AAGTTCTTTT AGATCCTAAT 
ACCTTATCCT CAGATGGAAC CGTTGCATTA TCAGGTTTAG CTATCTCAAA AAATGCCCAA 
TATTTAGCCT ATGGGTTATC AACATCTGGA TCAGATTGGG TAGAATGGAA AGTCAAAAAT 
ATTGAAACTG GAGAAGACTT ATCAGACCAT TTAAAATGGA TTAAATTTTC TGGTGCATCT 
TGGACAAATG ATCACCAAGG ATTTTTCTAT AGTCGCTACA ATGAACCCAA TGAAAAAAGC 
AAACTCGAAG ACATTAATTA TTACCAAAAA CTCTATTATC ATCGCCTAGG AACAACCCAA 
GATCAAGATA TTTTAGTTTA TGATCGTCCC GATCAAAAAG AATGGGGTTT TAATGGCAAC 
GTCACCGAAG ATGGACGCTA TTTAATTATT AGTGTTTGGC AAGGAACTGA TCCCAAGAAT 
TTGCTTTTTT ATAAAGATTT ACACGATCCT AACGCTGCTG TTATCGAACT GATTAATCAA 
TTTGAAGCGA GTTATGGATT TATTGATAAT GAGGGGTCAA CTTTTTGGCT AAGAACAGAC 
TTAAACGCGC CTAAAAAGCG GATTATTGCC ATTGATATCA ACAACCCAAG TCAAGATAAT 
TGGCAAGAAA TTATTCCCGA AACAGAAGAT ACATTAGACG GAGTAGGCAT TTTAAATAAT 
CAATTTGTTT GTGATTATCT AAAAAACGCA AAATCTGCTA TTAAAATCTT CGATCTCCAA 
GGAACTTTGA TCCGAGAAGT TGACTTACCT GACTTGGGAA TTGTCGGAGG ATTTGAAGGC 
AAACGATACG AGACAGAAAC CTTCTACAGT TTTGCTAATT TTACCACACC ATCAACCATT 
TATCATTATG ATATGATCAC GGGTAAAAGT ACTCTATTCC GTCAACCCAA TGTTCATTTT 
AATCCTCAAG ACTTTGAAAG CAAACAAGTT TTTTATATCA GCAAGGATGG AACTAAAATT 
CCTATGTTTA TTACCCATAA AAAAGGGTTA AAATTAGAGG GAAAAAATCC TACTTATTTG 
TATGGATATG GTGGGTTTAA TGTTTCTCTA ACTCCTAGCT TTTCCATTAG CAATATTGTC 
TGGATGGAAC AGGGAGGAAT TTATGCTGTC CCTAACCTAA GAGGAGGAGG AGAATACGGA 
GAAGAATGGC ATCAAGCAGG GATGAAATTA AACAAACAAA CTGTTTTTGA TGACTTTATT 
GCTGCGGCAG AATGGTTAAT AAAAAATAAC TATACATCAC CCCAAAAATT AGCTATTGGA 
GGGGGAAGTA ATGGGGGTTT ATTAGTGGGA GCTTGCATGA CCCAAAGACC GGATTTATTT 
AAGGCTGTCT TGCTATCCGT TGGGGTATTA GATATGCTAA GATTTAATCA ATTTACCATT 
GGTTGGGCTT GGTGTCCAGA GTATGGTAGT CCCGAAAATG AAGCAGAGTT TAAAGTACTT 
TATGCCTATT CTCCCTTACA TAATGTTAAG CCACAAACCG TCTATCCAGC TACCTTGATC 
ATAACAGCAG ACCACGATGA TCGCGTCGTT CCTGCCCATA GTTTTAAATT TGCTGCAGCC 
TTACAAACCG CTCATCAAGG CAATAATCCT ATTCTAATTC GAATTGAAAC AAAAGCAGGA 
CATGGTGCAG GAAAACCCAC CACAAAAATG ATTGAAGAAA TTGCAGATAA GTGGGCATTT 
TTAATCAATA ATTTAAAAGA GGGTTAG

Protein sequence

MSSYFSKFSY PLSQQQDIID IYHGITVKDP YRWLENPDSE ETQTWIKAQN QLTFDYLANI 
SVREPLKKRL TELWNYEKYG IPFKEGDRYF YFKNDGLQNQ SVFYTLKTLK DEPQVLLDPN 
TLSSDGTVAL SGLAISKNAQ YLAYGLSTSG SDWVEWKVKN IETGEDLSDH LKWIKFSGAS 
WTNDHQGFFY SRYNEPNEKS KLEDINYYQK LYYHRLGTTQ DQDILVYDRP DQKEWGFNGN 
VTEDGRYLII SVWQGTDPKN LLFYKDLHDP NAAVIELINQ FEASYGFIDN EGSTFWLRTD 
LNAPKKRIIA IDINNPSQDN WQEIIPETED TLDGVGILNN QFVCDYLKNA KSAIKIFDLQ 
GTLIREVDLP DLGIVGGFEG KRYETETFYS FANFTTPSTI YHYDMITGKS TLFRQPNVHF 
NPQDFESKQV FYISKDGTKI PMFITHKKGL KLEGKNPTYL YGYGGFNVSL TPSFSISNIV 
WMEQGGIYAV PNLRGGGEYG EEWHQAGMKL NKQTVFDDFI AAAEWLIKNN YTSPQKLAIG 
GGSNGGLLVG ACMTQRPDLF KAVLLSVGVL DMLRFNQFTI GWAWCPEYGS PENEAEFKVL 
YAYSPLHNVK PQTVYPATLI ITADHDDRVV PAHSFKFAAA LQTAHQGNNP ILIRIETKAG 
HGAGKPTTKM IEEIADKWAF LINNLKEG