Gene Ssed_3421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssed_3421
Symbol
ID	5610720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sediminis HAW-EB3
Kingdom	Bacteria
Replicon accession	NC_009831
Strand	+
Start bp	4171733
End bp	4173193
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	47%
IMG OID	640934361
Product	Xaa-His dipeptidase
Protein accession	YP_001475153
Protein GI	157376553
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2195] Di- and tripeptidases
TIGRFAM ID	[TIGR01893] aminoacyl-histidine dipeptidase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.11643
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACAGCAT TAAGTCAATT ACAACCTCAA GCCCTGTGGC AGTGGTTCGA ACAAATTTGT 
GCAATTCCCC ATCCATCTAA ACATGAGCAG GCTTTGAGCG AACATATTCA AGCCTGGGCC 
AAAGATAAAC AACTCGAACT GGTTGAAGAT AAAGTCGGTA ACCTCATCAT TAAGAAGCCT 
GCTACACCGG GTATGGAAAA CCGTAAGGTT GTTGCCCTGC AGGCTCATAT CGATATGGTG 
CCGCAGAAGA ACTCTGATAA AACGCATGAT TTCGAGAAAG ACGCGATTGA ACCTTTTATC 
GATGGTGAAT GGGTAAAAGC GACCGGAACA ACCTTAGGTG CCGATAATGG TATCGGCATG 
GCGTCTGCAT TAGCCATTTT AGGTTCAGAC GATATTCCTC ACGGCCCACT GGAAGTCCTG 
CTGACAATAG ATGAAGAAGC GGGCATGACG GGTGCATTTG GACTGGAAGC CGGTTACCTG 
AATGCAGATA TTCTGATCAA CACAGACTCT GAGCAGGAAG GCGAGATCTA CATGGGTTGC 
GCCGGTGGTG TTGACGGACA GATTAGCGTG CCTATGGTTT GGCAAGCTCC TGAGCAAAGT 
CACTCAACCT ACACCTTAAC CCTTTCAGGC TTGAAAGGTG GCCATTCAGG GGTAAACATT 
CACTTGGGTC GCGGTAACGC GAATAAACTA TTAGCTCGCT TCCTGTTTAA CCATGCAGAC 
GAATTAGCCT TAGAGTTAAC GAACTTCACT GGTGGCTCTC TGCGAAATGC TATCCCACGT 
GAAGCCTCGG TAAGCTTTAT GCTGCCAGCT GAAAACATCA CAAAACTTGA TGCCCTGGCG 
AAAGAGTTTC AGGCGTTAGT AAGAGAAGAG CTTGCTATTG CCGATCCGGA CATGGTGCTG 
GAGCTACTCG AAGCCCCGGC TGCTAAACAA GTGATGAGCG AAGATGCTCA GAATATGCTT 
ATCGACCTAC TTAATGCGTG TCCAAATGGC GTTATCCGCA TGAGTGATGA GGTTGAAGGC 
GTTACTGAAA CATCATTAAA TGTAGGTGTG ATTAGCACAG AAGCAGAAAG TGTTGAAGTT 
CTTTGCTTAA TTCGCTCTCT TATCGATTCT GGTCGCCAGG AAATTGAAAC TGTTTTAACT 
TCACTCACCA ACCTAGCCGG TGCTGAAATC CAGTTTAGCG GCGCATATCC AGGCTGGAAG 
CCAGACAACA GCTCACCGGT AATGGCATTG GTACGCGAGA CCTACGACAG CATCTACAAC 
AAAGAGCCTG TGATCATGGT GATTCATGCC GGACTCGAGT GTGGTCTGTT TAAGAAACCC 
TACCCTGAGA TGGATATGGT ATCGATTGGC CCAACCATTC GTTACCCACA CAGTCCGGAT 
GAAAAAGTCT TGATTGAAAC CGTTGATCAA TACTACAAGC TACTGTTAGC CGTACTGGAA 
CGTATTCCAG AGAAAGGTTA A

Protein sequence

MTALSQLQPQ ALWQWFEQIC AIPHPSKHEQ ALSEHIQAWA KDKQLELVED KVGNLIIKKP 
ATPGMENRKV VALQAHIDMV PQKNSDKTHD FEKDAIEPFI DGEWVKATGT TLGADNGIGM 
ASALAILGSD DIPHGPLEVL LTIDEEAGMT GAFGLEAGYL NADILINTDS EQEGEIYMGC 
AGGVDGQISV PMVWQAPEQS HSTYTLTLSG LKGGHSGVNI HLGRGNANKL LARFLFNHAD 
ELALELTNFT GGSLRNAIPR EASVSFMLPA ENITKLDALA KEFQALVREE LAIADPDMVL 
ELLEAPAAKQ VMSEDAQNML IDLLNACPNG VIRMSDEVEG VTETSLNVGV ISTEAESVEV 
LCLIRSLIDS GRQEIETVLT SLTNLAGAEI QFSGAYPGWK PDNSSPVMAL VRETYDSIYN 
KEPVIMVIHA GLECGLFKKP YPEMDMVSIG PTIRYPHSPD EKVLIETVDQ YYKLLLAVLE 
RIPEKG