Gene Shew_0020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shew_0020
Symbol
ID	4920935
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella loihica PV-4
Kingdom	Bacteria
Replicon accession	NC_009092
Strand	+
Start bp	23495
End bp	24817
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	56%
IMG OID	640161532
Product	proline dipeptidase
Protein accession	YP_001092152
Protein GI	127510955
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00930691
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAACT TAGCCACCCT CTATCCCGCC CACATTATTG AACTGAACCG GCGCGTCGCC 
GAGATCACCG CAAGAGAGCA GTTGGCCGGC TTAGTGATTC ATTCGGGTCA GCCTCATCGT 
CAGTTTCTCG ATGATCTGGA TTACCCCTTT AAAGTTAATC CGCACTTCAA GGCCTGGCTT 
CCGGTTATCG ATAATCCCCA CTGCTGGCTG ATCGTCAACG GTCGGGATAA GCCGCAACTC 
ATCTTCTATC GTCCGGTGGA TTTTTGGCAT AAGGTCGCCG ATCTACCAGA GGATTTTTGG 
ACGACCGAGA TAGAGATTAA AGTGCTGACC AAGGCCGACA AGGTGGCAGA TCTGCTGCCG 
GGCAAGTTGC AGGAGTGGGC CTATATTGGC GAGCATCTGG ATGTCGCCGA TGTGCTGGGC 
TTCGGAAGCC GTAACCCCGA GGCGGTGATG AGCTACCTGC ATTATCACAG AGCCAGCAAG 
ACGGCCTATG AGTTGGCCTG CATGCGCCGG GCGAGTGAGA TCGGTGTGCG TGGTCATGTG 
GCGGCCAAGA GTGCCTTCTA TGCGGGCGCG AGCGAGTTTG AGATCCAGCA AGCCTACCTG 
GCTGCGACTG ATATGGGCGA GAACGATGTG CCCTACGGCA ACATTATCGC ACTGAATCAA 
AACGCCGCGA TTCTGCACTA CACGGCGCTG GAGCATGTGT CGCCCAAGCA GCGACTCTCC 
TTCCTTATCG ATGCCGGTGG TAGCTTCCAT GGCTATGCCT CGGACATCAC CCGTACCTAT 
GCCTTCGAGA AGAACCTGTT CGGCGACCTG ATCGCCGCCA TGGACAAGTT ACAGCTGGCC 
ATCATCGAGA TGATGCGTCC GGGCGTGAAG TATGTAGATC TGCATCTGGC GACACACCAG 
AAGCTGGCAC AGCTGCTGCT GGACTTCAAG TTAGTGCAAG GCGATCCCCA AGGACTGATA 
GAGCAGGGGA TCACCAGCGC CTTCTTCCCC CATGGTCTGG GGCATATGTT GGGCCTACAG 
GTACATGATA TGGGCGGCTT CCTCCACGAC GAGCGCGGCA CCCACATTGC ACCGCCGGAG 
GCGCATCCCT TCCTGCGCTG TACCCGCACC CTGGCCGCTA ACCAGGTGCT GACCATAGAG 
CCAGGGCTTT ACATCATCGA CAGCCTGCTT AACGAGTTGA AACAGGATGG TCGCGCCGAT 
TGGATTAACT GGCAGATGGT GGATCAGGTG CGCCCCTTCG GTGGCATTCG TATCGAAGAC 
AATGTGATCG TCCATAGCGA TCATAACGAA AATATGACTC GCGATCTGGG TCTGCACGGT 
TAA

Protein sequence

MENLATLYPA HIIELNRRVA EITAREQLAG LVIHSGQPHR QFLDDLDYPF KVNPHFKAWL 
PVIDNPHCWL IVNGRDKPQL IFYRPVDFWH KVADLPEDFW TTEIEIKVLT KADKVADLLP 
GKLQEWAYIG EHLDVADVLG FGSRNPEAVM SYLHYHRASK TAYELACMRR ASEIGVRGHV 
AAKSAFYAGA SEFEIQQAYL AATDMGENDV PYGNIIALNQ NAAILHYTAL EHVSPKQRLS 
FLIDAGGSFH GYASDITRTY AFEKNLFGDL IAAMDKLQLA IIEMMRPGVK YVDLHLATHQ 
KLAQLLLDFK LVQGDPQGLI EQGITSAFFP HGLGHMLGLQ VHDMGGFLHD ERGTHIAPPE 
AHPFLRCTRT LAANQVLTIE PGLYIIDSLL NELKQDGRAD WINWQMVDQV RPFGGIRIED 
NVIVHSDHNE NMTRDLGLHG