Gene Sbal223_0021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_0021
Symbol
ID	7089233
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	+
Start bp	25539
End bp	26861
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	47%
IMG OID	643458945
Product	proline dipeptidase
Protein accession	YP_002355988
Protein GI	217971237
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00000247485
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGATCAGT TGGCTCATCA CTATCGTGCC CATATTGCCG AGTTAAACCG TCGAGTCGCA 
GAGATTTTGT CTCGAGAAGC CTTGTCTGGT TTAGTGATCC ATTCGGGTCA GCCGCATCGG 
ATGTTTTTGG ATGATATCAA TTATCCCTTT AAGGCAAACC CGCACTTCAA GGCATGGTTG 
CCTGTGTTGG ATAATCCGAA TTGTTGGTTA GTGGTCAACG GCCGTGATAA GCCGCAGCTG 
ATTTTTTATC GTCCTGTGGA TTTTTGGCAC AAAGTGTCTG ATGTGCCTGA TATGTTTTGG 
ACTGAGTATT TCGATATTAA GCTGCTGACC AAGGCTGATA AGGTCGCTGA GTTTTTACCG 
ACAGATATCG CCAATTGGGC CTATTTAGGT GAGCATTTAG ATGTGGCCGA AGTGCTGGGT 
TTTACCAGTC GTAATCCCGA TGCTGTGATG AGTTATTTGC ATTACCACAG AACCACTAAA 
ACCGAATATG AGCTGGAATG CATGCGCCGC GCGAATCAAA TTGCGGTGCA GGGACATTTG 
GCGGCTAAAA ATGCCTTTTA TAATGGTGCG AGCGAGTTCG AAATCCAGCA GCACTATTTA 
TCTGCCGTAG GCCAGAGCGA GAATGAGGTG CCCTATGGCA ATATCATCGC CCTTAACCAA 
AATGCGGCGA TTTTGCATTA CACCGCACTT GAACACCAAA GCCCTGCGAA ACGTTTGTCA 
TTTCTTATCG ATGCCGGCGC GAGTTACTTT GGCTATGCCT CTGATATCAC CAGAACCTAC 
GCATTTGAGA AGAATCGTTT CGATGAATTG ATCACTGCGA TGAACAAGGC GCAGCTAGAG 
CTTATCGACA TGATGCGTCC GGGTGTGCGT TATCCCGATT TACACTTGGC CACCCATGCT 
AAAGTCGCGC AAATGCTATT GGATTTTGAT TTAGCCACAG GTGATGTCCA AGGTTTGGTC 
GATCAAGGCA TAACCAGTGC TTTCTTCCCC CATGGCTTAG GTCACATGTT AGGCCTACAA 
GTGCATGATG TTGGCGGCTT TTCCCACGAT GAACGCGGTA CTCATATCGC GGCGCCAGAG 
GCCCATCCAT TCCTACGTTG CACCCGCATT TTAGCGCCAA ACCAAGTGCT GACCATGGAA 
CCTGGGTTAT ACATTATCGA TACTCTGCTT AATGAGCTTA AACAAGATAG TCGTGGCCAA 
CAGATCAACT GGCAAACGGT TGATGAGTTA AGGCCTTTTG GCGGTATTCG TATCGAAGAT 
AACGTCATAG TGCATCAAGA TAGAAACGAG AACATGACCC GTGAACTCGG TTTGACCGAT 
TGA

Protein sequence

MDQLAHHYRA HIAELNRRVA EILSREALSG LVIHSGQPHR MFLDDINYPF KANPHFKAWL 
PVLDNPNCWL VVNGRDKPQL IFYRPVDFWH KVSDVPDMFW TEYFDIKLLT KADKVAEFLP 
TDIANWAYLG EHLDVAEVLG FTSRNPDAVM SYLHYHRTTK TEYELECMRR ANQIAVQGHL 
AAKNAFYNGA SEFEIQQHYL SAVGQSENEV PYGNIIALNQ NAAILHYTAL EHQSPAKRLS 
FLIDAGASYF GYASDITRTY AFEKNRFDEL ITAMNKAQLE LIDMMRPGVR YPDLHLATHA 
KVAQMLLDFD LATGDVQGLV DQGITSAFFP HGLGHMLGLQ VHDVGGFSHD ERGTHIAAPE 
AHPFLRCTRI LAPNQVLTME PGLYIIDTLL NELKQDSRGQ QINWQTVDEL RPFGGIRIED 
NVIVHQDRNE NMTRELGLTD