Gene Shewmr4_1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_1039
Symbol
ID	4251112
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	+
Start bp	1212682
End bp	1213896
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	50%
IMG OID	638117612
Product	phosphopentomutase
Protein accession	YP_733176
Protein GI	113969383
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1015] Phosphopentomutase
TIGRFAM ID	[TIGR01696] phosphopentomutase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.536446
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000000672539
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAACGTA CAGTTATAAT GATGTTGGAT TCCTTTGGCG TGGGCGCCGC TGGCGATGCC 
GCCAAGTTTG GGGATCTAGG TTCTGATACT TTTGGCCATA TCGCTAAAGC GTGTGCCGAA 
GGTAAAGCCG ATATCGGCCG TGAAGGCCCG TTAACGCTGC CAAACTTGGC GCGTTTAGGT 
TTAGCCCATG CGGCGATGGA AAGCACTGGG GCGTTTGCTC CAGGCTTTGC GGACGATGTT 
GAGCTGATTG GTGCCTATGG CCACGCTCAG GAATTAAGTT CGGGTAAAGA TACTCCGAGC 
GGTCACTGGG AAATGGCGGG TGTGCCCGTA TTATTCGACT GGGGCTATTT CAGCGAGCAC 
CAAAACTCGT TCCCTAAAGA GCTGACAGAT AAGATTCTCG CCCGTGCAGG ACTCGATGGC 
TTTTTAGGTA ACTGCCATGC TTCTGGTACC ACGATTCTGG AAGAATTAGG CGAAGAGCAC 
ATGCGTTCTG GCAAGCCGAT TTTTTACACT TCGGCGGATT CGGTATTCCA GATTGCCTGC 
CATGAAGGCA CATTTGGTTT AGAAAATTTA TATCGTCTTT GCGAAATCGC CCGCGAAGAG 
TTAGAGCCTT ACAACATTGG CCGCGTGATT GCGCGTCCAT TCGATGGCAC TGGCCCAAGC 
GATTTTGCTC GTACTGGTAA CCGTAAGGAT TACTCCCTCG AGCCGCCAGC GAAGACGGTA 
TTAGATAAGT TAAAAGCCGC CGGTGGTGAA GTGGTGAGTG TGGGCAAGAT TGCCGATATT 
TACGCTTACT GTGGTATCAC CAAAAAGGTG AAGGCAAACG GTTTAGAAGC GCTATTTGAT 
GCGACTTTAG ACGAAGTGAA ATCAGCGGGT GAAAATACTA TTGTATTCAC TAACTTTGTT 
GATTTTGACT CCCACTATGG TCACCGCCGT GATGTGGCAG GTTATGCGAA AGGGCTGGAG 
TATTTCGACT CGCGTTTACC TGAAATGCTC GCGCTGCTGG ATGAGGACGA TCTATTAATC 
CTCACCGCTG ATCATGGTTG CGACCCAACA TGGCAAGGTA CGGATCATAC CCGTGAATAT 
GTGCCTGTAT TGGCCTATGG CGCAGGGCTA AAAGCCGGTT CACTCGGTCG CCGTAACAGT 
TTCGCCGATA TCGGCCAATC TATCGCAAGC TACTTCAAGC TTGAGCCGAT GGAATACGGT 
GAGTCGTTTA TCTAA

Protein sequence

MKRTVIMMLD SFGVGAAGDA AKFGDLGSDT FGHIAKACAE GKADIGREGP LTLPNLARLG 
LAHAAMESTG AFAPGFADDV ELIGAYGHAQ ELSSGKDTPS GHWEMAGVPV LFDWGYFSEH 
QNSFPKELTD KILARAGLDG FLGNCHASGT TILEELGEEH MRSGKPIFYT SADSVFQIAC 
HEGTFGLENL YRLCEIAREE LEPYNIGRVI ARPFDGTGPS DFARTGNRKD YSLEPPAKTV 
LDKLKAAGGE VVSVGKIADI YAYCGITKKV KANGLEALFD ATLDEVKSAG ENTIVFTNFV 
DFDSHYGHRR DVAGYAKGLE YFDSRLPEML ALLDEDDLLI LTADHGCDPT WQGTDHTREY 
VPVLAYGAGL KAGSLGRRNS FADIGQSIAS YFKLEPMEYG ESFI