Gene Sama_3073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_3073
Symbol
ID	4605320
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	+
Start bp	3651391
End bp	3652740
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	55%
IMG OID	639782489
Product	serine protease
Protein accession	YP_928945
Protein GI	119776205
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID	[TIGR02037] periplasmic serine protease, Do/DeqQ family

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0102381
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.200966
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCAA AACTCTCCCT CGTATCCGCC GCTATTTTAG GTGCAACCCT GACCCTTGGC 
ACCCTGCCCG CTTATGCCTC TTTGCCGGTA GCCGTTGACG GACAGCAGCT GCCAAGCCTT 
GCGCCCATGT TGGAAAAAAC CACTCCGGCT GTGGTCTCGG TTGCTGTGTC GGGTACCCAT 
GTCTCCAAGC AGCGGGTCCC CGATGTATTC CGCTATTTTT TTGGTCCCAA CGCGCCTCAG 
GAGCAGGTTC GTGAACGCCC CTTTCGCGGA CTGGGCTCGG GCGTCATTAT CGATGCAGAC 
AAGGGCTATA TAGTCACCAA CAACCACGTT ATTGATGGCG CAGACACCAT ACAGATTGGT 
TTGCTCGATG GGCGCGAATT TGAAGCCAAG CTCATCGGCA GCGACAGTGA ATCCGATATT 
GCGTTGCTGC AAATCAAGGC GGATAAACTG ACCGAGATTA AGTCGGCCGA CTCAGATGCC 
ATCCACGTGG GCGACTTCGC CGTAGCCATA GGCAACCCCT TTGGTCTGGG CCAAACAGTG 
ACCTCAGGCA TAGTCTCTGC CTTGGGCCGC AGTGGTCTGG GTATCGAGAT GCTGGAAAAC 
TTTATCCAAA CCGACGCGGC TATCAATAGC GGTAACTCAG GCGGCGCACT GGTGAATCTT 
CGTGGCGAGC TGATTGGTAT CAATACCGCC ATCGTTGCTC CCGGCGGCGG CAACGTGGGT 
ATAGGTTTTG CCATTCCCGC CAACATGATG CATTCACTGG TGGATCAGAT TATCGAACAT 
GGTGAAGTGC GCCGCGGTGT ACTCGGCATC TCCGGACGTG AGCTCGACAG TAAACTGGCC 
GAAGGCTTTG GTCTGGACTC CCAGCACGGT GCCTTTGTGA ATGAAGTCAT GCCAGACAGC 
GCAGCCGACG ACGCTGGCAT CAAAGCCGGT GACATCATCA TCAGCGTTGA TGGCCGTAAG 
ATTAAGAGCT TCCAGGAACT GCGCGCCAAA ATAGGCACTC TGGGCGCCGG TGCCAAGGTG 
GAACTGGGCA TCATCCGCGA CGGCAAAAAC AAGACAGTGA AGGTCACGTT GGGCGAAGCG 
TCCAATCAAA CAGCCTCCGC TGATGAGTTG CACCCTCAGC TGGCCGGTGC AAATCTCGAA 
AGCACCTCCA AAGGGGTTGA AATCATGGAA GTACAGGAAG GCTCCCCTGC CGCTCTGAGC 
GGTCTGCGCA AGGGTGATAT CATAGTGGGT GTCAATCGCA CTGCCGTGAA AGACCTGAAA 
GAGCTCAGAG AGCAACTGAA AGAACAGGAT GGCGCTGCCG CCCTGAAAGT ACTGCGAGGA 
AAGAGCATCC GTTATCTCGT ACTGAGATAA

Protein sequence

MKAKLSLVSA AILGATLTLG TLPAYASLPV AVDGQQLPSL APMLEKTTPA VVSVAVSGTH 
VSKQRVPDVF RYFFGPNAPQ EQVRERPFRG LGSGVIIDAD KGYIVTNNHV IDGADTIQIG 
LLDGREFEAK LIGSDSESDI ALLQIKADKL TEIKSADSDA IHVGDFAVAI GNPFGLGQTV 
TSGIVSALGR SGLGIEMLEN FIQTDAAINS GNSGGALVNL RGELIGINTA IVAPGGGNVG 
IGFAIPANMM HSLVDQIIEH GEVRRGVLGI SGRELDSKLA EGFGLDSQHG AFVNEVMPDS 
AADDAGIKAG DIIISVDGRK IKSFQELRAK IGTLGAGAKV ELGIIRDGKN KTVKVTLGEA 
SNQTASADEL HPQLAGANLE STSKGVEIME VQEGSPAALS GLRKGDIIVG VNRTAVKDLK 
ELREQLKEQD GAAALKVLRG KSIRYLVLR