Gene Shewmr4_1600 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_1600
Symbol
ID	4252177
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	-
Start bp	1895009
End bp	1896148
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	49%
IMG OID	638118213
Product	cupin 4 family protein
Protein accession	YP_733734
Protein GI	113969941
COG category	[S] Function unknown
COG ID	[COG2850] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATACAC TCAATCTCGA TATCGCCCAG TTCCTCAAGG AACACTGGCA ACAAAAACCT 
GTAGTCATCA AGGGCGCCTT CCCTGATTTT GAAGATCCGA TCAGCGCAGA TGAGCTTGCA 
GGCCTTGCCT GTGAAGAAGA AATCACCTCG CGCATTGTGG TCACTCAAAA AGACAACTGG 
GAAGTGATCC AAGGCCCGTT CGAGGATTAC GACAATTACG GTGAAACCCA CTGGCAATTG 
CTGGTGCAAG CCGTAAACCA TTGGTATCCG GACTCTCAGC CATTAGTGGA AGCGTTTCGT 
TTTCTACCCG ACTGGCGATT CGATGATTTG ATGGTGTCCT TCGCGACGCC AAGTGGCGGT 
GTCGGTCCAC ACGTTGATAA CTACGATGTG TTTATCATCC AAGGTGAAGG CGAGCGTCGT 
TGGACTGTGG GTGCTAACAC GCCGCAACAA CGCCGTGGCG GTAACCCGAA CTCGCCACTG 
GTGGAAGACT TCGAGCCCAT CATCGACGTG GTATTAGAGA AAGGCGACGT GCTATATATT 
CCGCCTGGCT ACCCACACTG CGGTGAAACC TTAACCTTAG CCTTAAGCTA TTCAATTGGT 
TACCGCGCAC CGAGCCAACA AGAACTCGCC AGTGAAGTTG CCGATTACCT GCTTGACAAT 
AACTTAGGTC AGCAGCGTTT TACCTCTGTG ACTGAGCCTG CAAATCCTGG CGTGATAAGT 
CAAGATCATC AACTCGGGAT CATGTCCCTG TTAAGTCAGC TCGCCCAAGA TCCAACAAGC 
TACCAAGTGG TGCTGGGTAA ACTGTTGAGT CAAAACCGTT TTGAACTGGA TATTTGCGAG 
GGTGAAGAAG CCTATAACAT TGAAGAGCTG CAGGATGCGT TCGAGCAAGG CGCTGGCGTT 
AATCGCATCG GCGGCTTAAA AGTGCTGCGT TTAGAAAACG ACACTCAATC TCGCTTATTC 
ATCAATGGCG AAATTTATGA GCTACCCAAT ACGCCTGAAG CCGTATTAAC CCAGTTAAGC 
GACCATGTTA GCTTTGATAG CGACAGTGCC ATAGCACTGT GTGAATATGC CGAAGTGCAA 
ACGCTACTGC TCAAGCTAAT CAATCAAGGC TTATATTATT TAAGTGACGA TGAAGACTAA

Protein sequence

MYTLNLDIAQ FLKEHWQQKP VVIKGAFPDF EDPISADELA GLACEEEITS RIVVTQKDNW 
EVIQGPFEDY DNYGETHWQL LVQAVNHWYP DSQPLVEAFR FLPDWRFDDL MVSFATPSGG 
VGPHVDNYDV FIIQGEGERR WTVGANTPQQ RRGGNPNSPL VEDFEPIIDV VLEKGDVLYI 
PPGYPHCGET LTLALSYSIG YRAPSQQELA SEVADYLLDN NLGQQRFTSV TEPANPGVIS 
QDHQLGIMSL LSQLAQDPTS YQVVLGKLLS QNRFELDICE GEEAYNIEEL QDAFEQGAGV 
NRIGGLKVLR LENDTQSRLF INGEIYELPN TPEAVLTQLS DHVSFDSDSA IALCEYAEVQ 
TLLLKLINQG LYYLSDDED