Gene Shewana3_1778 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewana3_1778
Symbol
ID	4478665
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. ANA-3
Kingdom	Bacteria
Replicon accession	NC_008577
Strand	+
Start bp	2092479
End bp	2094530
Gene Length	2052 bp
Protein Length	683 aa
Translation table	11
GC content	48%
IMG OID	639726361
Product	carboxy-terminal protease
Protein accession	YP_869417
Protein GI	117920225
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0159186
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAAAAC TCACTTTGGC TACATCCATT GCCACTGTTT TTGTCGGATT CTCGGCTTGG 
GCTGTACCAC CCACGATTCA AATCAGCGAG TTACCCACTC TCAAGCAGGA AGCGCAGCAT 
AAAGTGGCGA GTAAGCGAGT GACGGATTTA TACACTCGTT CCCACTATCA CAGATTCGCC 
TTAGACGATG CGTTTTCGGC GCAGATCTTC GACCGTTACC TGCAACAACT CGATTACCGT 
CGTAATGTGC TGACGCAAGC CGATGTCGAC AGTTTTAAGC CTTATACCAA TCAATTCGAT 
GATATGTTGA GTTCGGGCGA TCTTGATCCT GCCTACAAGA TGTTTGATTT GGTGCAAAAG 
CGCCGCTACG AAGGCTTTGT GTACGCGCTT TCTCTGCTCG ATAAAGAGAT GGATTTCACC 
GTGCCAGGTG ATGCCTACGA GTACGACAGA GAAGATGCGG CTTGGCCGAA AGATCAAGCC 
GAGATCAACG AGTTGTGGCG CCAACGTGTT AAATACGATG CGTTGAATCT GAAACTCACA 
GGCAAGAAAT GGCCTGAGAT CGTCGATATT CTGCAAAAGC GTTATAACAA CGCCATCAAA 
CGTCTGACCC AGACCAATAG CGAAGATGTG TTCCAAGCGG TGATGAATGC ATTTTCTCGC 
AGCATCGAGC CACACACTAG CTATTTATCG CCCCGTAATG CTGAGCGTTT CCAAATGGAA 
ATGAACTTAA GCCTCGAAGG TATTGGTGCG CAGTTACAGC TCGAAGACGA TTACACTGTC 
ATCAAGAGTT TGATTGCAGG TGGTCCTGCG GCCAGCAGTG AAAAACTGTC GCCGGAAGAT 
AAGATTGTCG GTGTCGGCCA AGAAGGCGGT GAGATTGTTG ATGTGATCGG CTGGCGATTA 
GACGATGTGG TCGATCTGAT TAAAGGCCCT AAGGGCAGTA AAGTTATATT ACAGATTTTA 
CCTAAGAAGG GCGGTTCTAA CGCTAAGCCG TTCAATCTGA CCTTAGTGCG CGACAAAATC 
CGTCTAGAAG ACCGTGCCGC GACCTCAAAG ATCATCGAGC CAAAAGACGG TGAATACGCC 
AACCGTAAAG TGGGTGTGAT TCAAATTCCT GGTTTCTATA TGAATTTATC CCAGGATGTC 
GAAAAAGAAT TGGTGAAGTT AAACGAAGCC AAGGTTGAAG GTGTCGTTAT CGACTTACGT 
GGTAATGGCG GCGGTGCGTT AACCGAAGCC GTATTACTGA CCGGACTCTT TATCGATATG 
GGCCCTGTAG TGCAAGTGCG TGACGCCGAT GGTCGAGTGT CTGCCCACCG TGATAACGAT 
GGCAAGACGA CGTATGCTGG TCCGTTAACC ATTATGGTTG ACCGTTACAG TGCATCAGCC 
TCTGAGATTT TTGCCGCTGC CTTGCAAGAT TATGACCGTG CGCTGATTGT CGGTGAGTCT 
AGCTTTGGTA AAGGCACTGT GCAGCAGCAT AAGAGCCTGG GTCGTATCTA CGATATGTAC 
GAGAAGCCAA TTGGCCATGT GCAGTATACG ATTCAAAAGT TCTACCGTAT CAACGGTGGT 
AGTACGCAGC TTAAGGGCGT AACCCCGAAC ATTGCTTACC CAAGTGCGTT AGAGCCGGGT 
GAATACGGTG AAGCGGAAGA GAAGAATGCT CTACCTTGGG ACAAAGTGCC GATGGCGCAA 
TACGGTACGC TAAACGACAT CACTCCTGAG TTAGTGGCGA GTTTAGAGAA AAAACACCTT 
GCCCGTATTC AGAACGATGT TGAGTTTAAC TATATCAATC AAGATATTGC CGACTTTAAA 
AAGCATCATA AAGAGAAAAC TGTCTCCTTA GTTGAAAGTG AGCGTATTGC CTCACGTGAA 
GCCGATGAGA AGAAAGTCCT CGATAGAACC AACGAGCGTC GTGTTGCCCA TGGTTTAGCC 
GCGGTTAAAT CGATGGAAGA CATTAAAGAC AAAGACGATG TTGAAGCACC GGATGCCTTC 
TTAGACGAAA CGGCCTATAT CACCTTAGAT ATGGCGGATG CAAAAAAGCT GGCTAACGCT 
GGCACTAAAT AG

Protein sequence

MRKLTLATSI ATVFVGFSAW AVPPTIQISE LPTLKQEAQH KVASKRVTDL YTRSHYHRFA 
LDDAFSAQIF DRYLQQLDYR RNVLTQADVD SFKPYTNQFD DMLSSGDLDP AYKMFDLVQK 
RRYEGFVYAL SLLDKEMDFT VPGDAYEYDR EDAAWPKDQA EINELWRQRV KYDALNLKLT 
GKKWPEIVDI LQKRYNNAIK RLTQTNSEDV FQAVMNAFSR SIEPHTSYLS PRNAERFQME 
MNLSLEGIGA QLQLEDDYTV IKSLIAGGPA ASSEKLSPED KIVGVGQEGG EIVDVIGWRL 
DDVVDLIKGP KGSKVILQIL PKKGGSNAKP FNLTLVRDKI RLEDRAATSK IIEPKDGEYA 
NRKVGVIQIP GFYMNLSQDV EKELVKLNEA KVEGVVIDLR GNGGGALTEA VLLTGLFIDM 
GPVVQVRDAD GRVSAHRDND GKTTYAGPLT IMVDRYSASA SEIFAAALQD YDRALIVGES 
SFGKGTVQQH KSLGRIYDMY EKPIGHVQYT IQKFYRINGG STQLKGVTPN IAYPSALEPG 
EYGEAEEKNA LPWDKVPMAQ YGTLNDITPE LVASLEKKHL ARIQNDVEFN YINQDIADFK 
KHHKEKTVSL VESERIASRE ADEKKVLDRT NERRVAHGLA AVKSMEDIKD KDDVEAPDAF 
LDETAYITLD MADAKKLANA GTK