Gene Shewmr4_2110 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_2110
Symbol
ID	4252683
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	+
Start bp	2517009
End bp	2518574
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	49%
IMG OID	638118734
Product	hypothetical protein
Protein accession	YP_734240
Protein GI	113970447
COG category	[S] Function unknown
COG ID	[COG1322] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.664501
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATTTT CTCAATCTTT TTCCCTCGCC CAGATCATCG GCCTACTCGC CGTGGCCTTT 
TTAGGACTGT TAATCGGTGC CCTGCTCAAT CAACGTCTCA CTCGTTCTCG CTGGCAACAG 
TTTAAAGACG AATTAGAGCA AGAAATGCGG CAGGTAAACG AAGACGCCGA GCTCTCCCTC 
GCCCAGCAGC AAATTTTAGT CGACGATAAA GACAGCCAAC TGCGCCAGTG CCAACAGCGC 
TTAGAGCAAA AGATAGAACA ACTGGGCAAA GCCGAAGCCA TGGCCGAGCG CCTGCCGAGT 
TTAGAGCAAC AACTTGCCGA CAGCCATCGC CGCCAACTTG AGCTACAACT GGCCTTATCC 
AAATCCAATG CGATGCAACA AACCATTCAA GCCAAGGCTG ATGCCCAGCA ATCTGCGATG 
CAGGAAAAAA TCGCCACTTT AGAAATGGCC GAAGTGCGCC TGCAAACTCA GTTTGAGAAC 
CTTGCCAATC GAATTTTCGA AGAGCGCAGC GAAAGCTTTA AACATCAAAA TGCGAACCAG 
TTAGAAGGCG TGCTCGGGCC GTTAAAGCAG CAGTTAGAAG GTTTTAGACA GCAAATTCGC 
GAATCCTACA ACCATGAACA GTCGGAACGC AGCGCCCTTA AACATCAATT AGAACACCTG 
CGCGAGCTCA ACTTAAAAAT GAGCCAGGAT GCCATTAACC TGACCAAAGC CTTAAAGGGC 
GATAACAAGC AGCAAGGCAA CTGGGGCGAA GTGATTTTAG ACCGCGTGCT GCAAGAAAGC 
GGCCTGCGTG AAGGTCACGA ATACCACACC CAGCAGGATC TGAAGGACGA CAGCGGCAAA 
CGCTTTAAGC CGGATGTGAT CGTACATTTG CCTGAAAATA AAGACGTGGT GATCGATGCC 
AAAATGTCGC TCATCAGCTA CGAGCGCTAT TTTAATAGCG AAGATCCGCT GGTGCGTGAA 
CAGGCCATCA ATGAACACGT TTTATCGATC CGAAATCATA TTAAGGGCTT GAGTCAAAAG 
GATTATCAGC GTTTACACGG GCTAAAAAGC TTAGATTATG TGCTGATGTT TATCCCGATT 
GAACCCGCCT TCTTGCTGGC CCTAGAGCAT GACCCAAGCC TAGTTAACTT TGCCCTTGAG 
CAAAATATTA TGCTGGTCAG TCCAACCAAC CTCTTGGTTG CCCTGCGAAC AATCAATAAT 
ATCTGGCGTT ACGAGTATCA AAACCAGCAC GCCCAAACCA TTGCCAAACA GGCGGGTCGC 
ATCTACGACA AACTCTGTGG CTACCTCGAC GATATGGAAA AACTCGGCCG TGCTCTGGAT 
AACGCCGAAA AAACCTATCA CAGTGCCATG AACAAATTGT CATCGGGCAA AGGCAATTTA 
GTGCGTCAAG CGCATTTAAT GCAGCAACTA GGTGTTGATA CCAGCAAACA ACTCGATAAG 
ATGTTACTTG AGAAGGCGCT CAATGAAGCC TTAGACGAGG GTGATGCCCA GGACAGCAGT 
GATGATGATA CAAATCGCGA TACGCTTTTG ACCCATACTG AGGATGCCAC CGCACTCGAA 
CAATAA

Protein sequence

MPFSQSFSLA QIIGLLAVAF LGLLIGALLN QRLTRSRWQQ FKDELEQEMR QVNEDAELSL 
AQQQILVDDK DSQLRQCQQR LEQKIEQLGK AEAMAERLPS LEQQLADSHR RQLELQLALS 
KSNAMQQTIQ AKADAQQSAM QEKIATLEMA EVRLQTQFEN LANRIFEERS ESFKHQNANQ 
LEGVLGPLKQ QLEGFRQQIR ESYNHEQSER SALKHQLEHL RELNLKMSQD AINLTKALKG 
DNKQQGNWGE VILDRVLQES GLREGHEYHT QQDLKDDSGK RFKPDVIVHL PENKDVVIDA 
KMSLISYERY FNSEDPLVRE QAINEHVLSI RNHIKGLSQK DYQRLHGLKS LDYVLMFIPI 
EPAFLLALEH DPSLVNFALE QNIMLVSPTN LLVALRTINN IWRYEYQNQH AQTIAKQAGR 
IYDKLCGYLD DMEKLGRALD NAEKTYHSAM NKLSSGKGNL VRQAHLMQQL GVDTSKQLDK 
MLLEKALNEA LDEGDAQDSS DDDTNRDTLL THTEDATALE Q