Gene SO_3791 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SO_3791
Symbol
ID	1171435
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella oneidensis MR-1
Kingdom	Bacteria
Replicon accession	NC_004347
Strand	+
Start bp	3942266
End bp	3943456
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	50%
IMG OID	637345561
Product	renal dipeptidase family protein
Protein accession	NP_719328
Protein GI	24375285
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2355] Zn-dependent dipeptidase, microsomal dipeptidase homolog
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGCTA TCAATCACCG TCGCCGAACT CTGCTCAAAG GACTCAGTGC AGTTACTGGA 
TTGAGCGCCG CCAGTGCATT AAGCCCTTTT GCCAGTTTCT CTAGTCTTGC CGCGCCGCTC 
CCGCCACGTG CCCGGCGCTT ATATATCGAT GGATTATCCT TTTTGCCCGA TGATTTAGCC 
GATGTTCGCG CCTCAGGTCT TGATGCCTTT TTGTGCGATA TATCAGCCAT TGAGACCATT 
GAACAAGCCG ATGGCACTGT AAACTACAAG CGCACCTACA AAGCCTGCAT GGAAAGCATC 
CAACAAGCCG CCAAACGGGT GAGTGAGCAT CCGGATATCC TTTTACAAGG CTTAACAGGA 
CGCGATATAC AGCTTGCAAG GGAGAACAAT CGCACTGCGG TTTTCTTTCA AATTCAAGGT 
GCTGATTGCG TTGAAGAAGA TAGCGATGCT AACCAATGGG CGCGCGTTGA TGCGTTTCAT 
CGCCAAGGCC TATGCGCACT GCAGCTCACC CACCATTATG GCAATACCTT TGCGGGCGGC 
GCGCTAGATA ACGATGCCAA TGGCGGGCTC AATAAACCGC TGACTAATCA TGGTCGAGCG 
CTTATCGCAA AACTCAACCA AGCCAATATA TTAATTGATG TTAGCCACTC AAGCGCCCAG 
ACCGCTTTAG ATGTGGCGAA ACTGAGCCGC GCACCCATAG TTCAAAGCCA TGGCGCGGCA 
CGCGGGATCG TCAAGCATGC CCGTTGTAGC CCAGATGAAG TGATCCGTGC CATTGCTAAT 
TCAGGCGGTG TTTTTGGTGT CTTTATGATG AGCTTTTGGC TCACCAATAA GGCCATCCCA 
ACGGTCAATG ACTATATTCG CCAGTTAGAA TATGTTGCAC GCATTGGCGG GGTCGATTGC 
GTTGCCATCG CCAACGATTT TCCGCTGCGA GGCCAAGAGA ACTTATTAGC TCTCAATAAC 
GACAACACTC AAGGTGTTAA GGAATATCAG GATTGGTGGT ACAGCCTAAG GGCCAAAAAA 
GTATTAGGCT TTGATGCCGA GCCAAGGCAT GTGGTGATCC CAGAGTTAAA CCATATAGAA 
CGCATGAGTC GAATTGACGA CGCCTTAGCC AAGGCTCGAT TTAAATCGAC CGACCGTGAT 
CGCTTTATGG GTGGAAACTG GCACCGAGTG TTAAATCAAG TATTAATCTA A

Protein sequence

MKAINHRRRT LLKGLSAVTG LSAASALSPF ASFSSLAAPL PPRARRLYID GLSFLPDDLA 
DVRASGLDAF LCDISAIETI EQADGTVNYK RTYKACMESI QQAAKRVSEH PDILLQGLTG 
RDIQLARENN RTAVFFQIQG ADCVEEDSDA NQWARVDAFH RQGLCALQLT HHYGNTFAGG 
ALDNDANGGL NKPLTNHGRA LIAKLNQANI LIDVSHSSAQ TALDVAKLSR APIVQSHGAA 
RGIVKHARCS PDEVIRAIAN SGGVFGVFMM SFWLTNKAIP TVNDYIRQLE YVARIGGVDC 
VAIANDFPLR GQENLLALNN DNTQGVKEYQ DWWYSLRAKK VLGFDAEPRH VVIPELNHIE 
RMSRIDDALA KARFKSTDRD RFMGGNWHRV LNQVLI