Gene Shewmr4_1064 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_1064
Symbol
ID	4250769
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	-
Start bp	1245464
End bp	1246828
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	51%
IMG OID	638117637
Product	peptidase U32
Protein accession	YP_733201
Protein GI	113969408
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTAAAC CTGAGTTGTT ATCTCCCGCT GGGACGCTGA AAAACATGCG TTACGCTTTT 
GCCTATGGTG CAGATGCCGT GTATGCCGGC CAGCCGAGAT ACAGCCTGAG GGTTCGTAAT 
AACGACTTTA AAATGGAAAA CCTCGCGACG GGTATCGAAG AAGCCCATGC GTTGGGTAAA 
AAGCTTTATG TGGTGAGTAA CATTGCTCCC CACAACGCCA AGCTCAAAAC CTATATCAAA 
GATATGGAAC CGGTAGTGGC GATGAAGCCC GATGCGCTGA TCATGTCAGA TCCTGGCCTT 
ATCATGATGG TACGTGAGGC CTTCCCTGAG CAGGTGGTGC ATTTATCGGT GCAAGCCAAC 
GCCATTAACT GGGCATCGGT CAAATTCTGG CAGACCCAAG GCATTAAACG GGTAATTTTA 
TCCCGCGAAT TATCCTTAGA TGAAATCGAA GAAATCCGTC AACGCTGCCC CGATATCGAA 
CTAGAAGTGT TTGTCCACGG CGCCCTGTGT ATGGCTTACT CTGGCCGTTG TTTACTGTCG 
GGTTATATCA ATAAGCGCGA TCCAAACCAA GGCACTTGCA CTAACGCCTG CCGCTGGAAA 
TACGATGTGC ACGAAGCGCA GCAAACTGAC TCTGGCGATA TCATTGCCAC CCCCAATGCG 
GTGCAAATCG AGACGCCAAC CTTGGGCACG GGTCCTGCGA CCGACCAAAT CTTCCTGCTG 
CAAGAAGCCA ATCGCCCCGG CGAATATATG CCAGCGTTTG AAGATGAGCA TGGCACTTAT 
ATCATGAACT CTAAGGACTT GCGCGCAATC CAACACGTTG AGCGTTTGGC GAAAATGGGC 
ATCGACTCGC TGAAGATCGA AGGCCGTACT AAGTCGTTCT ACTATGTTGC CCGTACCGCC 
CAGCTATACC GTCAGGCCAT CGACGATGCC GCCTCAGGCA AGAGCTTCGA TCGCAGCCTG 
ATGAACCAAC TCGAAGGCTT AGCACACCGC GGCTATACCG AAGGTTTCTT ACGTCGCCAC 
GTACATGATG AATATCAAAA CTACGACTAT GGCTACTCGG TCAGCGATAC CCAACAATTT 
GTGGGCGAAT TAACCGGTAA ACGCAATCTG GCTGGCCTTG CCGAAATCGA AGTGAAGAAC 
AAATTCTCTG TCGGTGATAG TGTTGAATTA ATGACGCCAC AGGGCAATAT CAGCCTCACC 
ATCGAGCAAC TCGAGAACCG CAAAGCCGAA TCGGTTGAAG CGGGATTAGG TTCGGGCCAT 
ACCGTTTACT TGCCCGTGCC GAAAGAGGTT GATCTGAACC ACGGCATTTT ACTGCGTAAC 
CTGCCCCAAG GTCAGGATAC CCGTAACCCA CACGAAGCAG GCTAA

Protein sequence

MFKPELLSPA GTLKNMRYAF AYGADAVYAG QPRYSLRVRN NDFKMENLAT GIEEAHALGK 
KLYVVSNIAP HNAKLKTYIK DMEPVVAMKP DALIMSDPGL IMMVREAFPE QVVHLSVQAN 
AINWASVKFW QTQGIKRVIL SRELSLDEIE EIRQRCPDIE LEVFVHGALC MAYSGRCLLS 
GYINKRDPNQ GTCTNACRWK YDVHEAQQTD SGDIIATPNA VQIETPTLGT GPATDQIFLL 
QEANRPGEYM PAFEDEHGTY IMNSKDLRAI QHVERLAKMG IDSLKIEGRT KSFYYVARTA 
QLYRQAIDDA ASGKSFDRSL MNQLEGLAHR GYTEGFLRRH VHDEYQNYDY GYSVSDTQQF 
VGELTGKRNL AGLAEIEVKN KFSVGDSVEL MTPQGNISLT IEQLENRKAE SVEAGLGSGH 
TVYLPVPKEV DLNHGILLRN LPQGQDTRNP HEAG