Gene Shewmr4_1590 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_1590
Symbol
ID	4252167
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	-
Start bp	1879612
End bp	1880676
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	48%
IMG OID	638118203
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_733724
Protein GI	113969931
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00086934
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.179227
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATTA AAACAGACGA ATTACGCACT TCCTTATTAG CTAAAGTCAT CTCACCTGCA 
CAACTGGCAT CTGAGTACCC GTTAACCCAA GATGCAGCCG ATTATCTCGT ACAACAACGT 
CGTGAAGTCG AAGCCATTAT TATGGGCGAA GATCAACGCC TATTAGTGAT CATTGGCCCC 
TGCTCAATCC ATGATACTCA AGCCGCCCTC GACTACGCTC GCCGTTTAGC GGTATTGCAC 
CAAGAGTTAA AAGACGATCT CTGCATTTTA ATGCGTGTGT ATTTTGAAAA ACCCCGCACT 
ATCGTCGGTT GGAAAGGGTT AATCTCCGAT CCTGATTTAG ATGGCAGCTT CGAGCCAAAT 
AAAGGATTAC GTATTGCCCG TGAGTTACTG CAGCAAATTA CTGAACTGAA GTTACCGATT 
GCCACCGAAT TTTTAGACAT GGTGAATGGT CAATATATTG CCGATTTAAT CACCTGGGGC 
GCTATCGGTG CCCGCACCAC CGAAAGCCAA GTTCACCGCG AAATGGCCTC GGCGCTCTCC 
TGCCCCGTTG GCTTTAAAAA CGGTACCGAT GGCAATATTA ATATCGCCGT CGATGCGGTG 
CGCGCAGCAA AAGTGCCACA TATCTTCTAT TCACCGGATA AAGATGGCGC CATGTCGGTG 
TATCGCACCC ATGGTAATCC TTACGGGCAT ATCATTTTAC GTGGCGGCAA AAAACCGAAT 
TACTTTGAGC AAGATATTGA AGAAGCAAGA TTAAAGCTTG AGTCGGTCAA TGTGACGCCG 
CGCGTGGTAG TCGATTTTAG CCACGGCAAC AGTGAAAAGA ACCACCTGAA GCAGCTTGTG 
GTTGCCGATA ATATCATGGC GCAAATGCGC GCGGGCAGCA CGGCGATTGC CGGGGTGATG 
GCAGAAAGTT TCTTACAGGA AGGCAATCAA AAAGTGGTTG AGGGTCAACC TCTGTGTTAC 
GGCCAAAGCA TCACAGATGC TTGCCTGCAT TGGGATGACT CGGAGAAATT ACTGCGCGAT 
CTGGCTAAAG CCTCCCGTGA TAGACGTGAG TTCCTCGGCA AATAA

Protein sequence

MTIKTDELRT SLLAKVISPA QLASEYPLTQ DAADYLVQQR REVEAIIMGE DQRLLVIIGP 
CSIHDTQAAL DYARRLAVLH QELKDDLCIL MRVYFEKPRT IVGWKGLISD PDLDGSFEPN 
KGLRIARELL QQITELKLPI ATEFLDMVNG QYIADLITWG AIGARTTESQ VHREMASALS 
CPVGFKNGTD GNINIAVDAV RAAKVPHIFY SPDKDGAMSV YRTHGNPYGH IILRGGKKPN 
YFEQDIEEAR LKLESVNVTP RVVVDFSHGN SEKNHLKQLV VADNIMAQMR AGSTAIAGVM 
AESFLQEGNQ KVVEGQPLCY GQSITDACLH WDDSEKLLRD LAKASRDRRE FLGK