Gene Shewmr4_3423 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_3423
Symbol
ID	4253989
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	+
Start bp	4093427
End bp	4094467
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	54%
IMG OID	638120061
Product	peptidase M28
Protein accession	YP_735546
Protein GI	113971753
COG category	[R] General function prediction only
COG ID	[COG2234] Predicted aminopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCAATT TGGCACAGGC ATTCACAGCA ATCACTCGCC CCCGCGCTCA AGGCATTGGC 
TTGAGCTTAT TACGCTTGTG TATCCTCAGC TTGTGTTTGG GCCTTACGGC CTGCGCCAAT 
CAACCCGTCG AATACACTTG TTCACCTGAG GCGATTCGAT TGAATTGGGC CGAACCCTCA 
GTTCTTAAGC AAACGGTAGC AATACTCAGC GCCGCAGAAT TAATGGGGCG TAAAACCCAA 
ACGCAAGGCG CCGCCAAGAC TCGCGACTAT TTGAACAGCC AGTTTCAGCA ACTCGGACTC 
AAAGCGTGGG GAGAGACCTT CGAGGTGCCC TTCGAATATG CCACGCTTTT TAGCCAAGAG 
ACGGGAAGCA ATATGGTAGC GTTAGTCCCC GCACGCCAAC CCACTCATCG ATGGCGCATT 
GTGGTGGCTC ACTACGATCA TCTCGGCATG AGTGGCAGCA AGATTTACCA CGGCGCCGAT 
GATAACGCCT CAGGTGTTGC CGCCCTGTTG GCTCTGGCCG CCCACTGGCA AGCGCAGCTA 
AGCGCCGCCC CCGATTCGTT GCCCAACATT AACTTAATGT TTGTCGCGAC CGATGCCGAA 
GAGCCGGGGC TGTTTGGCAG TACGGCCCTC GTCGAGCAAC TCAAGCAGCG CATGCCCGAG 
GCGCAATTTG AACTGATGCT CAATCTCGAT ATGATTGGCC ATCCGACCCG ACCCTACGCT 
ATTTACCTCG AAGGCAGCCG CAACTTTTAT CAGTTTCCAC AATTTAGGAC CATGCTAAAC 
GCGAATAATC ACCTCTGTAT TAAGTTGAGC CATCCCAAAC CCGTGGGACG AAGCATCCAG 
AGTACCGACT GGCTGAGAGC CTCGGATCAT TATCCTTTCC ATAAAGCCAA GATCCCTTGG 
CTCTATTTTG GCGTCCCCAC TCATCCGCAA TACCATACCC CCGAGGATAC CCCCGACACC 
TTGGACTATG TTTTCCTCGC GGCGGTGACA GAATCCGCCT TCGAAATCCT ACGACTCAAT 
GGCGACTTTT TGAAAAATTA A

Protein sequence

MGNLAQAFTA ITRPRAQGIG LSLLRLCILS LCLGLTACAN QPVEYTCSPE AIRLNWAEPS 
VLKQTVAILS AAELMGRKTQ TQGAAKTRDY LNSQFQQLGL KAWGETFEVP FEYATLFSQE 
TGSNMVALVP ARQPTHRWRI VVAHYDHLGM SGSKIYHGAD DNASGVAALL ALAAHWQAQL 
SAAPDSLPNI NLMFVATDAE EPGLFGSTAL VEQLKQRMPE AQFELMLNLD MIGHPTRPYA 
IYLEGSRNFY QFPQFRTMLN ANNHLCIKLS HPKPVGRSIQ STDWLRASDH YPFHKAKIPW 
LYFGVPTHPQ YHTPEDTPDT LDYVFLAAVT ESAFEILRLN GDFLKN