Gene Ssed_1020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssed_1020
Symbol
ID	5609947
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sediminis HAW-EB3
Kingdom	Bacteria
Replicon accession	NC_009831
Strand	-
Start bp	1213148
End bp	1214638
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	51%
IMG OID	640931868
Product	carboxypeptidase Taq
Protein accession	YP_001472759
Protein GI	157374159
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2317] Zn-dependent carboxypeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.16508
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAGC CCAACCTAAG CCCCCATTAC GACAGGCTCA CAAAACATTT TCAGACAATC 
TCTCATTTCG AACACCTGAG TGCTCTGGGT GACTGGGATC AGGCGACGAT GATGCCAGTC 
GGCGGAGGCG CCGCCCGCGG CGCTGCGATG GCTGAGTTAG CCAAACATAT TCACGAGCTA 
AAAACAGCCC CTTTCCTTGC CGACACACTA CAACTTGCTC AAGATGAGAT GCTAACTCGC 
GAGCAAGCTG CGAACCTGAA AGAGATGAAT TATCAATTTT TTCAGGCCAA CGTGATCCCC 
GCATCACTGG TTAAGGCTAA GACTGAGCTC GCCTACCGAT GTGAACATGC CTGGCGTGAT 
CAGCGCAAGA ATAATGACTG GCAGGGGTTC AGACCTAATC TCGAAGCCTT GATGGCACTC 
GTTAAAGAGG AGGCGAATAT CCGTTCACAG GCACAAGGCT TATCACCTTA TGATGCCCTA 
CTGAACAAAT TTGAACCAGG CATGACGACC GAGCGTCTCG AATCGGTATT TGGTCACCTT 
AAAACCTGGC TGCCCTCGCT TATTCAGCGA GTTCAGCATG AACAGGCCAA AGAGCACAGG 
TTTAATATCG AATCCTGCGG CAGTCAGGCT CAGGAGACAC TGGGACGAGA GGTGATGGAC 
TTTCTCGGAT TTGATTTTAC TCAGGGTCGA TTAGATGTCA GTAGCCATCC CTTTTGTGGT 
GGGGTGCCCG GTGATGTTCG CCTGACGACC CGCTACGATG AGTCCGATTT CACCAGCGCC 
TTAATGGGGG TTATCCATGA GACGGGCCAT GCCAGATATG AGCAGGGGTT ACCGGTTAAC 
TGGCGAGGAC AGCCTGCCGG CCATGCTCGC TCGATGGCTA TCCATGAGAG CCAGAGTCTG 
TTCTGTGAAA TGCAACTGGG ACGCGGCAGC GGATTCCTCT CCCATTTACA ACCCAAAATA 
GCCAAACACT TAGGTAGCCA ACTTTCAACG GAGCAACTGA CCAATATCTA CACCCGGGTT 
AATCCTGGTC TTATCAGGGT CGATGCCGAT GAGATCACCT ACCCTTGTCA TGTCCTACTC 
AGATTCGAAG CCGAGAAAGG CTTAATCGAT GGCAGTCTCA GTGTCGCCGA TCTGCCAGAA 
TTCTGGGCCC AGCAGATGAG TTCGTTATTA GGCGTTAACA CCCAGGGCAA CTTTAAAGAT 
GGTTGCATGC AAGATATACA CTGGGCCGTG GGCGAACTTG GATACTTCCC CAGTTACACC 
TTAGGCGCTA TGTATGCGGC TCAATTTCGT TTTGCCATGG AGGCGAGCTT AGGCTCGGTG 
GACACCTTGG TTGCCCAGGG AAATATCGCT CAAATATTTG AGTGGCTGGA ACAGAAAATT 
TGGTCACAGG GAAGCCTGTT AAATACAGAC GAACTGGTCA AACAGGCCAC AGGCGAAACT 
CTGAACCCCG ATTATTTCAA ACGACACCTG GAGCAAAGGT ATCTGAAATA A

Protein sequence

MTQPNLSPHY DRLTKHFQTI SHFEHLSALG DWDQATMMPV GGGAARGAAM AELAKHIHEL 
KTAPFLADTL QLAQDEMLTR EQAANLKEMN YQFFQANVIP ASLVKAKTEL AYRCEHAWRD 
QRKNNDWQGF RPNLEALMAL VKEEANIRSQ AQGLSPYDAL LNKFEPGMTT ERLESVFGHL 
KTWLPSLIQR VQHEQAKEHR FNIESCGSQA QETLGREVMD FLGFDFTQGR LDVSSHPFCG 
GVPGDVRLTT RYDESDFTSA LMGVIHETGH ARYEQGLPVN WRGQPAGHAR SMAIHESQSL 
FCEMQLGRGS GFLSHLQPKI AKHLGSQLST EQLTNIYTRV NPGLIRVDAD EITYPCHVLL 
RFEAEKGLID GSLSVADLPE FWAQQMSSLL GVNTQGNFKD GCMQDIHWAV GELGYFPSYT 
LGAMYAAQFR FAMEASLGSV DTLVAQGNIA QIFEWLEQKI WSQGSLLNTD ELVKQATGET 
LNPDYFKRHL EQRYLK