Gene Shewmr7_1991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr7_1991
Symbol
ID	4256619
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-7
Kingdom	Bacteria
Replicon accession	NC_008322
Strand	-
Start bp	2354513
End bp	2356246
Gene Length	1734 bp
Protein Length	577 aa
Translation table	11
GC content	50%
IMG OID	638122657
Product	dihydroxy-acid dehydratase
Protein accession	YP_738037
Protein GI	114047487
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0134932
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000282177
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGAATAATA AAAAACCGAA AACACTTCGT TCGGCTAGTT GGTTTGGTAG TGATGACAAA 
AATGGCTTTA TGTATCGCAG TTGGATGAAA AACCAAGGCA TACCCGAGCA TCACTTTCAA 
AATAAGCCTG TGATTGGTAT TTGCAATACC TGGTCAGAAT TGACGCCCTG TAATGGTCAT 
CTACGGGAAT TGGCGCAAAG AGTAAAGAAT GGCATTCGGG AAGCGGGTGG CATTCCAGTG 
GAGTTTCCAG TGTTTTCGAA TGGCGAGTCC AACTTACGTC CAAGCGCCAT GCTTACCCGT 
AATCTTGCTG CCATGGACAC GGAAGAAGCC ATTCGAGGCA ACCCCATCGA CGGAGTTGTG 
CTGTTAGTGG GCTGTGATAA AACGACTCCG GCTTTATTGA TGGGCGCGGC CAGTTGTGAT 
TTACCGACAA TCGTTGTTAC CGGTGGTCCC ATGCTCAATG GTAAGCATAA GGGCAAGGAT 
GTCGGTTCGG GCACACTCGT GTGGGAACTG CATCAAGAAT ATAAAGCGGG CAACATCAGT 
CTCGCCGCAT TTATGAATGC CGAAGCGGAT ATGTCACGCT CAACGGGCAC CTGCAACACT 
ATGGGCACAG CATCGACCAT GGCCTGTATG GTGGAAACCC TTGGGGTGAG TTTGCCACAC 
AATGCAGCCA TTCCTGCGGT GGATTCTCGC CGCCAAGTAT TGGCGCATAT GTCGGGAATG 
CGAATTGTGG ACATGGTCAA AGAGGATTTG ACCTTAAGTA AAATTTTAAG CCGTGATGCT 
TTTATTAATG CCATCAAAGT CAATGCTGCC ATTGGTGGTT CAACCAACGC CGTTATCCAT 
TTAAAGGCGA TTGCCGGCAG GATAGGGGTA GAGCTGTCAC TCGATGACTG GCGCCATGGT 
TACACTGTAC CGACCATAGT GAATCTTAAG CCTTCGGGTC AGTACTTAAT GGAAGACTTT 
TACTACGCAG GTGGCCTGCC AGCAGTATTA AGGCAGCTGT TTGAACATGA TTTACTGAGC 
AAAAACACGC TCACAGTCAA TGCCGCTAGC CTCTGGGACA ATGTCAAAGA GGCGCCTTGT 
TATAACCAAG AGGTGATCAT GTCACTTGAA AATCCCTTGG TTGAAAATGG CGGCATTCGC 
GTACTTCGCG GCAATCTCGC GCCCCGAGGC GCAGTGATCA AAACTTCAGC CGCCAGCGCA 
CACCTGATGC AGCACCGCGG TAAAGCCGTG GTGTTTGAAA GCTTCGACGA TTACAACGCC 
CGCATCGGCG ATCCTGAATT GGATATCGAT GAAAACAGCA TTATGGTGCT TAAAAACTGT 
GGCCCGAAGG GATATCCGGG CATGGCTGAG GTCGGCAATA TGGGACTGCC ACCTAAGTTG 
TTGAAAAAAG GAATTAAGGA CATGGTTAGG ATTTCTGATG CACGCATGAG TGGCACCGCC 
TTTGGCACAG TTGTGCTGCA TGTTGCCCCA GAAGCACAAG CCCTTGGGCC ACTGGCCGCC 
GTTCAAAATG GTGACATGAT AGCGCTTGAT ACCTATGCCG GAACGTTACA GCTGGAGATC 
AGTGACCAAG AGTTACAAGC CCGTCTTGCC AAACTGGCAA CGGTGAAATC CATTCCAGTG 
AATGGTGGCT ATCTCTCGCT CTTTAAGGAG CATGTTCTCC AGGCGGATGA GGGATGTGAT 
TTTGATTTTC TCGTGGGATG TCGAGGTGCA GAGATACCAG CACATTCCCA TTAA

Protein sequence

MNNKKPKTLR SASWFGSDDK NGFMYRSWMK NQGIPEHHFQ NKPVIGICNT WSELTPCNGH 
LRELAQRVKN GIREAGGIPV EFPVFSNGES NLRPSAMLTR NLAAMDTEEA IRGNPIDGVV 
LLVGCDKTTP ALLMGAASCD LPTIVVTGGP MLNGKHKGKD VGSGTLVWEL HQEYKAGNIS 
LAAFMNAEAD MSRSTGTCNT MGTASTMACM VETLGVSLPH NAAIPAVDSR RQVLAHMSGM 
RIVDMVKEDL TLSKILSRDA FINAIKVNAA IGGSTNAVIH LKAIAGRIGV ELSLDDWRHG 
YTVPTIVNLK PSGQYLMEDF YYAGGLPAVL RQLFEHDLLS KNTLTVNAAS LWDNVKEAPC 
YNQEVIMSLE NPLVENGGIR VLRGNLAPRG AVIKTSAASA HLMQHRGKAV VFESFDDYNA 
RIGDPELDID ENSIMVLKNC GPKGYPGMAE VGNMGLPPKL LKKGIKDMVR ISDARMSGTA 
FGTVVLHVAP EAQALGPLAA VQNGDMIALD TYAGTLQLEI SDQELQARLA KLATVKSIPV 
NGGYLSLFKE HVLQADEGCD FDFLVGCRGA EIPAHSH