Gene Tery_4393 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_4393
Symbol
ID	4246046
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	6767366
End bp	6769438
Gene Length	2073 bp
Protein Length	690 aa
Translation table	11
GC content	41%
IMG OID	638109277
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_723854
Protein GI	113477793
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG4934] Predicted protease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.550046
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGAAAC CACAAAACCA GAATTTGCCA TCTATTATTT ATGCTGAAGT TTCTGTACGT 
TCTCAGAGTG GAGATTCACT TTTGAAAACA TCAGAGATAA TTACCAGCAA GAATGTAGAG 
CGGTTTTATT CAGAACCTCA GTTAGTTAAT GCCACCGCAG AAAAGTTGCG TGCTGAAGGT 
TTTAATGTTT TCTCTGAGGG ACCAATAAGT ATTACTATTG CTGCCCCTCC AGAAGTTTAT 
GAACGGGTTT TTCAGACTAA TATTATTACC CAAGAAATTC CCATAATTAA AGGAGGACTT 
TACCCAACAA AAGCAACATT TTTATCTGTT CCCAACGCAG AAATATCAGG GTTAATAGAT 
GCCTCTGGTA GCTCTTTAAC TAACTTGATA GAAGGAGTGG CAATTAATGA ACCTGTCTAT 
AATACGGCCT CAGTTACTCC TCCAAAACCC AACTATTGGC ATCTCAATGT ACCAGATGAT 
ATTTGTCAAG GCATAAATGC TCATCGACTT CATGACCAAG GTATCACAGG AAGTGGTGTC 
AAGGTAGTCA TGGTTGATAC TGGCTGGTAT CGTCATCCTT TTTTTGAGTC TCATGGTTAT 
CAAGGTAAGG TGGTGCTGGA TGGGGGTGCA GTTAACCCAG AATTAGATGA AAATGGTCAC 
GGGACCGGGG AATCAGCTAA TCTGTTTGCT ATTGCACCAA ATGTTGAGTT GACAATGGTT 
AAGGCTAAGT CAAAAAAATC TGCATTGGTT AATTCAGTAG GAGCATTTAA AAAAGCGGTT 
TCCCTAAATC CTGATATTAT ATCCTGTAGT TGGGGTGATG ATCAAAGAGA CCCTCCTCTT 
TCTGCTTTTG CTAAAGTAAT GTCAGCGATA GTTTCAGATG CAGTAAATCG GGGAATTATT 
GTTGTTTTCT CCGCTGGAAA TGGAGGCTGG AGTTTTCCTG GACAACATCC TGATGTGATT 
TCTGCTGGCG GTGTTTATAT GTCTTCTGAT GGCAAGTTGG AAGCTAGTGA CTATGCTAGT 
GGGTTCAGGA GCAGAATTTT TCCCCAACGA ACTGTGCCTG ATGTTTGTGG TTTAGTGGGC 
AAACTACCAC GGGCAACTTA TATTATGTTG CCAGTACAGC CGGGGAGTCT GATGGATGTT 
ACTCGTGGAG CACGAAATAT TGGCTATCCT TATGGAGATG AGACTTTGCC GAAGGATGGT 
TGGGCTGTGT TTAGTGGTAC ATCTGCAGCA GCTCCTCAGT TGGCGGGTAT TTGTGCTTTG 
ATGAAGCAGG TATATCCTCA AATTTCACCC CAACAAGCTC GGGATTTTCT GAAAAAAACT 
GCTCGTGATA TTTTTACGGG GAAAAGTAGT TTGAGTACGG GAGGAAATCA GGCAAATGCT 
GGCGTGGATC TGGCAACTGG GTCTGGTTTA GCTGATGCTT TTCAGGCAAC AATGATGGCA 
GCTAAGGCTA GCGGCAAGAC TATTTTAAAT AGCACTCAAT TAGCACAGCA ACAACCAGAG 
AAATTTTTAG TTACAAATCA AATTCAAACA AAGGAGATTA TTATGGACTG CAAACTTGGA 
AAATATTACG AAGAAATTCT TTGGGCTTTA GATAAAGCAC TGCAAAATGT AGAAGGAGTT 
GAGGGTGAGT ATCAGTTGGT TATTAGTCAG GCTAACTTGA TTTCTCGCAC ACCAGCAATG 
AAGGCAGCAT ATCGTTTGAG GATGTTGCTA GAGCCAGTGT TATTATTACC AAAGGATCCA 
GAAGATAAGC CCCCAAAGGA TAAGGAGGAA CATAATAATT TATATCAATG CCTTAAGAGT 
GGCGTTTCAG CTGCTGAAGG TTTATTGAGT ATGAAGCAAT ATCAGGAAAC TGCGTTAAAT 
GGTCTTGTAA AAATAATTGA TTATTTAAAT GCTTCATGGT GGGAATTGAA AGATAAATCA 
GATGTGCAGT CGCGGGCAAT TAAAGCTTTA GGGGAAATTA GTAATACTAA TAATATCAAT 
AGTCGATTAA TCCCTAAAAC TATATTAGAT GGAGGAAGAT GTTACTGTGA AACGGATGAA 
CAAGGAAACT GCTACCCGAT ATGCGAGGAT TGA

Protein sequence

MVKPQNQNLP SIIYAEVSVR SQSGDSLLKT SEIITSKNVE RFYSEPQLVN ATAEKLRAEG 
FNVFSEGPIS ITIAAPPEVY ERVFQTNIIT QEIPIIKGGL YPTKATFLSV PNAEISGLID 
ASGSSLTNLI EGVAINEPVY NTASVTPPKP NYWHLNVPDD ICQGINAHRL HDQGITGSGV 
KVVMVDTGWY RHPFFESHGY QGKVVLDGGA VNPELDENGH GTGESANLFA IAPNVELTMV 
KAKSKKSALV NSVGAFKKAV SLNPDIISCS WGDDQRDPPL SAFAKVMSAI VSDAVNRGII 
VVFSAGNGGW SFPGQHPDVI SAGGVYMSSD GKLEASDYAS GFRSRIFPQR TVPDVCGLVG 
KLPRATYIML PVQPGSLMDV TRGARNIGYP YGDETLPKDG WAVFSGTSAA APQLAGICAL 
MKQVYPQISP QQARDFLKKT ARDIFTGKSS LSTGGNQANA GVDLATGSGL ADAFQATMMA 
AKASGKTILN STQLAQQQPE KFLVTNQIQT KEIIMDCKLG KYYEEILWAL DKALQNVEGV 
EGEYQLVISQ ANLISRTPAM KAAYRLRMLL EPVLLLPKDP EDKPPKDKEE HNNLYQCLKS 
GVSAAEGLLS MKQYQETALN GLVKIIDYLN ASWWELKDKS DVQSRAIKAL GEISNTNNIN 
SRLIPKTILD GGRCYCETDE QGNCYPICED