Gene Sama_0033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_0033
Symbol
ID	4602290
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	+
Start bp	36808
End bp	38127
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	53%
IMG OID	639779342
Product	proline dipeptidase
Protein accession	YP_925915
Protein GI	119773175
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.12189
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0842725
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAATT TGGCCCCGCT GTACGTCAAT CACATCAATG AACAAAACCG CCGGGTGGCC 
GATGTGTTGG CCCGGGAACA ACTTGAAGGC CTGGCCATTC ATTCAGGCCA ATATCACCGT 
CAGTTTTTGG ATGACATCAA CTATCCCTTT AAGGCAAATC CGCATTTCAA GGCCTGGCTG 
CCGGTGCTGG ATATTCCCAA CTGCTGGATA CTAACCAATG GGCGTGATAA GCCTGTGTTG 
GTGTTCTATC GCCCTGTGGA TTTCTGGCAT AAGGTCAGCG ATGTGCCCGA GAGTTTCTGG 
ACCGAGCATT TTGAAATTAA GCTGCTGACT AAGGCAGAGA AGGTGGCGGA TTTGCTGCCA 
AAGAACCTCG ATACCTGGGC TTATATTGGT GAACATCTGG ATGTGGCCGA CGTGCTGGGC 
TTCAAGAATC GCAATCCCGA TGGAGTGATG AACTACTTCC ATTGGCACAG AAGCTTCAAG 
ACAGACTATG AGCTTGCCTG TATGCGTGAG GCAAACCGAG TCGCGGTGGC AGGCCATAAT 
GCTGCGAGAG AAGCCTTCTA CAAGGGCGCC AGTGAGTTTG AAATACAGCA GCAATATTTG 
TCGGCCATAG GTCAGGGCGA GAATGACGTG CCTTACGGCA ACATCATTGC TCTGAACCAA 
AATGCGGCCA TCCTGCACTA CACCGCGCTG GAGCACGCGG CGCCTGCCAA CCGGCATTCG 
TTTTTAATCG ATGCAGGCGC TTCTTTTAAT GGCTACGCCG CAGACATAAC CCGCACCTAT 
GCATTTGAAA AAAATGTGTT TGATGAGCTT ATCAAGGCAA TGGACAAGAT GCAGCGGGAG 
CTGGTGGACA TGATGCGTCC CGGTGTGCGC TTTACCGATC TGCATCTGGC TACACATCAC 
AAATTGGCTC AGCTGCTGCT GGAGTTTGGT ATCGCCAGGG GCGAGGCCAG CGACTTGGTG 
GAGCAGGGGG TGACCAGTGT GTTCTTCCCT CATGGGCTTG GGCATATGTT GGGCTTACAG 
GTGCACGATG TGGCTGGGTT TGCCCATGAT GAGCGTGGCA CCCATTTGGC TGCGCCAGAG 
CGTCATCCCT TCCTGCGCTG TACCCGAGTT CTTGCGCCAC GCCATGTGCT GACCATAGAG 
CCTGGTTTTT ACATCATCGA CAGTCTGTTG ACCGAACTGA AGGCCGATGG CCGGGCTGAA 
GCAGTGAACT GGGACATGGT AAATACACTG CGTCCCTTTG GCGGCATACG TATTGAGGAT 
AACGTGATTG TGCATCAGGA GCGCAACGAG AATATGACCC GGGATCTGGG GCTTAACTGA

Protein sequence

MENLAPLYVN HINEQNRRVA DVLAREQLEG LAIHSGQYHR QFLDDINYPF KANPHFKAWL 
PVLDIPNCWI LTNGRDKPVL VFYRPVDFWH KVSDVPESFW TEHFEIKLLT KAEKVADLLP 
KNLDTWAYIG EHLDVADVLG FKNRNPDGVM NYFHWHRSFK TDYELACMRE ANRVAVAGHN 
AAREAFYKGA SEFEIQQQYL SAIGQGENDV PYGNIIALNQ NAAILHYTAL EHAAPANRHS 
FLIDAGASFN GYAADITRTY AFEKNVFDEL IKAMDKMQRE LVDMMRPGVR FTDLHLATHH 
KLAQLLLEFG IARGEASDLV EQGVTSVFFP HGLGHMLGLQ VHDVAGFAHD ERGTHLAAPE 
RHPFLRCTRV LAPRHVLTIE PGFYIIDSLL TELKADGRAE AVNWDMVNTL RPFGGIRIED 
NVIVHQERNE NMTRDLGLN