Gene Shewmr4_1041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_1041
Symbol
ID	4251114
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	-
Start bp	1214865
End bp	1216085
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	49%
IMG OID	638117614
Product	membrane protein
Protein accession	YP_733178
Protein GI	113969385
COG category	[R] General function prediction only
COG ID	[COG3726] Uncharacterized membrane protein affecting hemolysin expression
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.66781
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.000114763
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGTTATATC TTAAAGGGCT AAAGAAAAGC CATAAAATCA GTAGACTGCT CCAAATCGCC 
ATCGCCCTGA CCTTGATGGT CGGCTTAGTG CAATTGTGGC AGACAAGCCT ACTACAAGGT 
CAGCTGCTTC TAAAGTCCCA AACGCAAAAG ATGGCCAGAT TACTGGTACA ACAAACGGCC 
TACAGCGCAG CGCCCGCCCT ACAATTGCAA AACGATGAGC AGCTCCAATG GCTGGCCAGC 
GCCTTAGTCG AAGATCCTAA GGTGATGTCG GCAGCCATTT TCAGCGACCA AGGTATACGC 
TTAGCCTTCG CCCAAAGCCT GACCAATGAA GCCTTAGATC CCGAATCGGA AGACATGAGT 
TTGCTCCTAA GCAAATATCC ACCTTATGTC GAACCCGTGA TCCAAGATGG AAAAAATTTA 
GGCTATGTCG AGGTTAGACT CGATACCAAA CTATTTTTTA ATGAAATCAA AGAAGCGCAT 
AACCTAAATA TGGAGCAGCA GCAAATGATG CTGCTGGTTG CCGGCCTTAT CGGCATGTTG 
TTATCCCGCG CCTTGTCCTT TAAGCGCGCC GATTTTGACC GCCGTCGCAC CCGCGCCAAA 
TTGCGTAAAA ACCCTAAGAA GAATAAAGCC ATAAAAGTAC CCGAAGCGGC CGAGGAAGCT 
AAGCCATCGG ATAGTCAAGA TACCCAGCAG GATGCCGTTA TCGCAAGTGG CACTGAGGCA 
GTGCAAAAGC CGGCAGAAGC TAAAAAGGCA AAAGAAAGCA AAGCAGAACA GGATCTCGAC 
ACTCCGCTCT TGGAGAAATC GGCTGTAAGC AAGGCGCAGA ATGAAGACAG CAATCAAGCC 
ATTGCCGAAT CTAAAGCGAA GAAAGCCAAA ACAAGCGCAG AAACAAAAGC TGCACTTGCG 
CCAGAACCCG TATCAGAGAA AGCAGCAGAG AAAGCGCTTG ATGTGAAGCC AGAGCTTAAA 
CCAGAGATAA AACCAGAGAA AGAGACCAAG GATGAGTCAT CATCTGAGCC AACGCCTCAG 
TCTCAGTCTC AGTCTCAATC TAAAACGGAT ACCAGAGAAC AGGCGACTCA AGCTTCAGTC 
ACCGAGGCGC CAAGCTCAAC GCCCGCGCCG AATAAACCTA AGGTTAAATC GGTGCGTCGA 
GTGAAAACCA CTGCGGCGAA ATCTACCGCA GAGAAAGCCC CTGCTCAACC GAGCGATTTA 
GATACCGATT CTACGGGTTA A

Protein sequence

MLYLKGLKKS HKISRLLQIA IALTLMVGLV QLWQTSLLQG QLLLKSQTQK MARLLVQQTA 
YSAAPALQLQ NDEQLQWLAS ALVEDPKVMS AAIFSDQGIR LAFAQSLTNE ALDPESEDMS 
LLLSKYPPYV EPVIQDGKNL GYVEVRLDTK LFFNEIKEAH NLNMEQQQMM LLVAGLIGML 
LSRALSFKRA DFDRRRTRAK LRKNPKKNKA IKVPEAAEEA KPSDSQDTQQ DAVIASGTEA 
VQKPAEAKKA KESKAEQDLD TPLLEKSAVS KAQNEDSNQA IAESKAKKAK TSAETKAALA 
PEPVSEKAAE KALDVKPELK PEIKPEKETK DESSSEPTPQ SQSQSQSKTD TREQATQASV 
TEAPSSTPAP NKPKVKSVRR VKTTAAKSTA EKAPAQPSDL DTDSTG