Gene Shewmr4_2037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_2037
Symbol
ID	4252610
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	+
Start bp	2422969
End bp	2424168
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	48%
IMG OID	638118653
Product	hypothetical protein
Protein accession	YP_734167
Protein GI	113970374
COG category	[S] Function unknown
COG ID	[COG4394] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000141693
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.000596189
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAGCGA TACACTCAAT GGCAACCACC GCCCCCCACT GGGACATCTT TTGCTGCGTC 
GTCGATAATT ACGGCGATAT CGGCGTCACT TGGCGCTTAG CCAAACAGCT GGTCAATGAA 
TATCAGCTCC CCATTATACT CTGGGTCGAT GACTTAAACA GCTTCTCGCA TATTTTACCA 
AGCCTTGATC CAAACCAAAG CAGCCAAGTC TTTAATGGCG TCACCATCAA TCATTGGACA 
ACGCCCCTGC CCGTGGCATT TGTGCCCGGC GCCGTGTTAA TTGAAGCCTT TGCCTGCGAA 
CTGCCTGACG AGGTCAAACA ACAACTCATC ACGCTGCACA GCACCACACC GCAAGCTGTG 
CCCGTATGGC TGAATTTAGA ATATTTAAGC GCCGAAGACT GGGTCGATGG CTGCCATGGG 
TTACCCTCGA TGCAGGCAAG TGGCATCAAA AAGTATTTCT TTTTCCCGGG TTTTACCCCA 
AAGACGGGTG GACTGATCTG TGAGCGTGAG CTGTTTGCCG AACGCGATGC ATGGCAACTG 
GATAGCACCA ATAAATTGCA ATTATTTGAG CGCCTTGGTC TTAAGGATAT TCAAGCGCAA 
GATACTGTCT ACAGTGTCTT TAGTTATGAA ACTGATTCTC TGCCGGCCTT ATGTGAGCTC 
TGGCAAGCCA GTGCAACAAG CGATGCCAAA ATCCATGCGC TTATTCCCAA GGGACGCAGC 
TTAAACAGCT TACAACACTT ATTACCCTGC AAGGTTGAGG CGCTCAGCCC CGGACAGCAA 
ATTAAGCTAG GTCATTTGAC CCTGCATATC TTGCCGATGA CAGACCAACA AGGGTTCGAC 
CGCCTGCTGT GGAGCTGCGA CTTTAATATT GTCCGCGGTG AAGACAGCTT CCTGAGGGCG 
CAATGGGCCG CTAAACCCTT CATTTGGCAT ATTTATCCGC AAGAAGATGA TTATCATCTA 
ATAAAATTAG AAGCTTTTAT CCAACTTTAC TGCGATAATC TGCCCCCTGA TATTGCTGGT 
ACTTGGTCTA AATTGAATGT TGCATTTAAC CAAGGCGAGC AATCTGCCGT GAAAACTCAC 
TGGCAAAACC TAAATCCTGT CAGTTTGCCA CTTTTGCAAC ATGCTAAAGA TTGGCCAATT 
GACGCAATAA ATGCTGCAGA TCTTGCGACT CGGCTAGTCC AATTCGTCAA AAAAAGCTAA

Protein sequence

MKAIHSMATT APHWDIFCCV VDNYGDIGVT WRLAKQLVNE YQLPIILWVD DLNSFSHILP 
SLDPNQSSQV FNGVTINHWT TPLPVAFVPG AVLIEAFACE LPDEVKQQLI TLHSTTPQAV 
PVWLNLEYLS AEDWVDGCHG LPSMQASGIK KYFFFPGFTP KTGGLICERE LFAERDAWQL 
DSTNKLQLFE RLGLKDIQAQ DTVYSVFSYE TDSLPALCEL WQASATSDAK IHALIPKGRS 
LNSLQHLLPC KVEALSPGQQ IKLGHLTLHI LPMTDQQGFD RLLWSCDFNI VRGEDSFLRA 
QWAAKPFIWH IYPQEDDYHL IKLEAFIQLY CDNLPPDIAG TWSKLNVAFN QGEQSAVKTH 
WQNLNPVSLP LLQHAKDWPI DAINAADLAT RLVQFVKKS