Gene Shewmr4_0578 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_0578
Symbol
ID	4251141
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	+
Start bp	666465
End bp	668867
Gene Length	2403 bp
Protein Length	800 aa
Translation table	11
GC content	55%
IMG OID	638117137
Product	hypothetical protein
Protein accession	YP_732715
Protein GI	113968922
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACCCC ATAGCCTAGC CCTCGCCATC CTACTCTTAG GTTTACCCGC GCTGAGCGTC 
GCCGCGGATC TGCCGAGCAC TAAAGTCGTT AAGCAGAGCC AAGCCGCTAA GGGATTTCTT 
AATTTATACT ATGAGCCAAG CGAGGGGGAG TTATACCTCG AGGTGAGCCG TTTAAATCAG 
CCTTTTTTAT TGGTGACTAG CTTGCCTGAA GGGGTCGGTT CTAACGATAT CGGTCTCGAC 
CGTGGTCAAT TAGGTCAAAC CCGCATGGTG CAGTTTGAGC GCCAAGGTCC CTACATTCAG 
CTTAAGCAAC TAAACACCCA GTATCGCGCT AATACCCAAG ACGCCGCCGA AAAGCGCGCC 
GTGGATGAGG CCTTTGCCGA TTCGGTATTG TGGCAGGGTA AGTTACTCGA TGGTAAGCCA 
GAGATGGTGG CTATCAGCGA GTTGGTACTC AACGATCTGC ACGGCGTCGC GGATGCTCTC 
CTGCATCGCG GGCAGGGGAA TTATCGCCTT GATTTAACCC GCTCGGCGAT TTTACCCGCC 
GGGGTGAAAT CTTTTGAAAA GAATAGTGAT GTGGATGTGC AGCTTACCTT CAAAGCCGAT 
GCGGCGGGTG AGCAAGTGGC TAAGGTCACG CCCGATGGCA CCTTAATGTC GGTGCGGATG 
CGCTACTCTT TTGTCGAGCT GCCCGATGAG GGCTATCAAC CTCGCGCTTA TCATCCTATG 
AGCGGCTATT TATCCGATGA GTATCGCGAC TATGCCACGC CGTTTTCGGC GCCACTGGTG 
CAGCGGTTTA TTTTGCGCCA CCGCCTGCAA AAGGTGAATC CTGGCCCTGC ACCGAGCGAA 
GTAGTCAAGC CCATCACCTA TTACCTCGAC CCAGGTGTGC CTGAGCCTAT CCGCTCGGCG 
CTACTCGATG GTGCTCGCTG GTGGGAAACG GCCTTCACCC AAGCGGGATT TATCAACGGC 
TTCAAGGTTG AACTCTTGCC ACCCGATGCC GATCCGCAGG ATATTCGCTA CAACATGATC 
CAGTGGGTAC ACCGCGCCAC GCGCGGATGG TCCTACGGCG CGGCGCTAAC CGATCCGCGT 
ACCGGCGAAA TCATCAAAGG CCAAGTGACC TTAGGTAGCT TGCGAGTGCG CCAAGATTAC 
TTGATTGCCA AAGGCTTAAC TGCAGGCTGG CGTGATAGAA GCGCCGCCGA GCAAGCGGCC 
AACGACTTAG CATTAGCGCG TATTCGCCAA CTTGCCGCCC ATGAGGTCGG CCATACCTTA 
GGCTTAGATC ATAACTTTGC CGCCTCGACC AATCAGGACG CGTCAGTGAT GGATTATCCC 
CATCCTAAGA TCATGCTAAA AGGTAATGAC ATTGATATAT CAGCACCTTA TGGCGTAGGT 
GTCGGGCTAT GGGATAACTT TGCTATCGCT TACGGCTATA GCGATGAAGG CGATGCCACT 
GCCCAGCAGG CGCTGCAAAA TCAGTTGCTG GCCGAAGTGG CTCGAAAAGG GCTGCGCTAT 
ATTGGCGAAG CCGATTCACG CCAAGCGGAT GCCAGCCAAG CCTATGCGAG TTTATGGGAT 
AGCGGTGACG ACCCTATCGT GCAGCTGCTG GATTTGAACC GGATTCGCAC TAAGGCCATC 
GAAGGTTTTA GCAGCACGGC CCTGTTGCCG GGCGAGCCAC TGGGTGAGCT AGCCGATGCC 
TTTGTGCCTA TCTATTTGCT TAATCGTTAC CAAATCGATG CGGTTATTAA GTTTATTGGC 
GGCACTGACT ACAACTATCT GTCCGTCGGC GAGGGTGGCC GCTGGAGCTA CATAGCGCCG 
CAGTTACAGC TGTCGGCCCT TGATGCGCTG CTAAGCACCT TAGATGCGGC CAGTTTAACG 
GTTCCGCAAA CCTTGCTCGA GACGCTGGTG CCTAAAGCGG GCAATTATCA AGCGACGCGG 
GAGTCCTTCG AGTCTGGGCT TGGGGTGGTG AGCGATCCCC TCGGTATGGC TGAAGTGCTA 
GCGCGCCATA CTGTGGGGCA GTTGTTGATG CCACAGCGCT TAAATCGCGT CAGCCAAGGG 
GCGATGGCGG ATAATGAGCA GCTCTCGATC GAAACCTTAC TCAATAAGCT GTTTGCCGCG 
ACCCTATACC AAGAAGACAA GCTCGCTCTG GTTGAAGGTG TGTGGATGCG GGTGAATGCG 
GTGGTGATCG ATGAACTCTT GTCTGCATAT CACAATCCGC AAACCTCAGC AGAGGTGAAG 
GCGGCTATTT ACGAGCGCGC CCAATTCGTG ATTAAACAGC TTAAAGCCAA AGCGAATCGC 
GCGAATGCTA AGGTGGCCTC CCACTACACT TGGTTGCAAC AGGGGCTGAG TGCAGGGCTC 
ACTGATGCCA ACAGCAAACT CATTCCAAAA CCCTTGAAAC TGCCGCCGGG TTCACCTATC 
TAA

Protein sequence

MKPHSLALAI LLLGLPALSV AADLPSTKVV KQSQAAKGFL NLYYEPSEGE LYLEVSRLNQ 
PFLLVTSLPE GVGSNDIGLD RGQLGQTRMV QFERQGPYIQ LKQLNTQYRA NTQDAAEKRA 
VDEAFADSVL WQGKLLDGKP EMVAISELVL NDLHGVADAL LHRGQGNYRL DLTRSAILPA 
GVKSFEKNSD VDVQLTFKAD AAGEQVAKVT PDGTLMSVRM RYSFVELPDE GYQPRAYHPM 
SGYLSDEYRD YATPFSAPLV QRFILRHRLQ KVNPGPAPSE VVKPITYYLD PGVPEPIRSA 
LLDGARWWET AFTQAGFING FKVELLPPDA DPQDIRYNMI QWVHRATRGW SYGAALTDPR 
TGEIIKGQVT LGSLRVRQDY LIAKGLTAGW RDRSAAEQAA NDLALARIRQ LAAHEVGHTL 
GLDHNFAAST NQDASVMDYP HPKIMLKGND IDISAPYGVG VGLWDNFAIA YGYSDEGDAT 
AQQALQNQLL AEVARKGLRY IGEADSRQAD ASQAYASLWD SGDDPIVQLL DLNRIRTKAI 
EGFSSTALLP GEPLGELADA FVPIYLLNRY QIDAVIKFIG GTDYNYLSVG EGGRWSYIAP 
QLQLSALDAL LSTLDAASLT VPQTLLETLV PKAGNYQATR ESFESGLGVV SDPLGMAEVL 
ARHTVGQLLM PQRLNRVSQG AMADNEQLSI ETLLNKLFAA TLYQEDKLAL VEGVWMRVNA 
VVIDELLSAY HNPQTSAEVK AAIYERAQFV IKQLKAKANR ANAKVASHYT WLQQGLSAGL 
TDANSKLIPK PLKLPPGSPI