Gene Shewana3_2070 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewana3_2070
Symbol
ID	4476316
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. ANA-3
Kingdom	Bacteria
Replicon accession	NC_008577
Strand	+
Start bp	2477453
End bp	2479213
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	50%
IMG OID	639726655
Product	dihydroxy-acid dehydratase
Protein accession	YP_869706
Protein GI	117920514
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000109007
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0000050577
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTGCCTTG GAAGACGAAG GTGTCATATG AATAATAAAA AACCGAAAAC ACTTCGTTCG 
GCTAGTTGGT TTGGTAGTGA TGACAAAAAT GGCTTTATGT ATCGCAGTTG GATGAAAAAC 
CAAGGCATAC CCGAGCATCA CTTTCAAAAT AAGCCTGTGA TTGGTATTTG CAATACTTGG 
TCAGAATTGA CGCCCTGTAA TGGTCATCTA CGGGAATTGG CGCAAAGAGT AAAGAATGGC 
ATTCGGGAAG CGGGTGGCAT TCCGGTGGAG TTTCCGGTGT TTTCGAATGG TGAGTCCAAC 
TTGCGTCCAA GTGCCATGCT GACCCGTAAC CTTGCGGCCA TGGACACGGA AGAAGCCATT 
CGTGGCAACC CCATCGACGG TGTTGTGCTG TTAGTAGGCT GCGATAAAAC GACTCCGGCT 
TTATTAATGG GCGCGGCCAG TTGTGATTTA CCGACAATCG TTGTTACTGG TGGTCCCATG 
CTCAATGGTA AGCATAAGGG TAAGGATGTT GGTTCGGGCA CACTCGTGTG GGAACTGCAT 
CAAGAATATA AAGCGGGCAA TATCAGCCTT GCCGCATTTA TGAATGCCGA AGCGGATATG 
TCACGCTCAA CGGGCACCTG TAACACTATG GGGACGGCAT CGACCATGGC TTGTATGGTG 
GAAACCCTTG GGGTGAGTTT GCCACACAAT GCAACCATTC CTGCGGTGGA TTCTCGCCGC 
CAAGTGCTGG CCCATATGTC GGGAATGCGA ATTGTGGACA TGGTCAAAGA GGATTTGACC 
TTAAGTAAAA TTTTAAGCCG TGATGCTTTT ATCAATGCCA TCAAAGTGAA TGCTGCCATT 
GGGGGGTCAA CCAACGCCGT AATCCATTTA AAGGCGATCG CCGGCAGGAT AGGGGTTGAG 
CTGTCACTCG ATGACTGGCG CCATGGTTAC ACAGTACCGA CCATAGTGAA TCTTAAACCT 
TCGGGTCAGT ACTTAATGGA AGACTTTTAC TACGCAGGTG GCCTGCCAGC AGTACTAAGG 
CAACTGTTTG AGCATGATTT ACTGAGCAAA AATACGCTTA CAGTCAATGC CGCTAGCCTC 
TGGGACAATG TCAAAGAGGC GCCGTGTTAT AACCAAGAGG TGATCATGTC ACTTGAAAAT 
CCCTTGGTTG AAAATGGCGG CATTCGCGTA CTGCGCGGCA ATCTCGCGCC TAGAGGCGCT 
GTGATCAAGC CTTCAGCCGC CAGCGCACAC CTGATGCAAC ACCGCGGTAA AGCCGTGGTG 
TTTGAAAGCT TCGACGATTA CAACGCTCGC ATCGGCGATC CTGAATTGGA TATCGATGAA 
AACAGCATTA TGGTGCTTAA AAACTGTGGC CCAAAGGGAT ATCCGGGCAT GGCAGAGGTC 
GGCAATATGG GACTGCCACC GAAGTTGTTG AAAAAAGGAA TTAAGGACAT GGTGAGGATT 
TCCGATGCAC GCATGAGTGG CACCGCCTTT GGCACAGTTG TGCTGCATGT TGCCCCAGAA 
GCACAAGCCC TTGGGCCACT GGCCGCCGTC CAAAATGGTG ACATGATAGC GCTAGATACC 
TATGCCGGAA CGTTACAGCT GGAGATCAGT GACCAAGAGT TACAAGCCCG TCTTGCCAAA 
CTGGCGACAG TGAAATCCAT TCCTGTGAAT GGTGGCTATC TCTCGCTCTT TAAGGAGCAT 
GTTCTCCAGG CGGATGAGGG CTGTGATTTT GATTTTCTCG TGGGATGTCG AGGTGCAGAG 
ATACCAGCAC ATTCCCATTA A

Protein sequence

MCLGRRRCHM NNKKPKTLRS ASWFGSDDKN GFMYRSWMKN QGIPEHHFQN KPVIGICNTW 
SELTPCNGHL RELAQRVKNG IREAGGIPVE FPVFSNGESN LRPSAMLTRN LAAMDTEEAI 
RGNPIDGVVL LVGCDKTTPA LLMGAASCDL PTIVVTGGPM LNGKHKGKDV GSGTLVWELH 
QEYKAGNISL AAFMNAEADM SRSTGTCNTM GTASTMACMV ETLGVSLPHN ATIPAVDSRR 
QVLAHMSGMR IVDMVKEDLT LSKILSRDAF INAIKVNAAI GGSTNAVIHL KAIAGRIGVE 
LSLDDWRHGY TVPTIVNLKP SGQYLMEDFY YAGGLPAVLR QLFEHDLLSK NTLTVNAASL 
WDNVKEAPCY NQEVIMSLEN PLVENGGIRV LRGNLAPRGA VIKPSAASAH LMQHRGKAVV 
FESFDDYNAR IGDPELDIDE NSIMVLKNCG PKGYPGMAEV GNMGLPPKLL KKGIKDMVRI 
SDARMSGTAF GTVVLHVAPE AQALGPLAAV QNGDMIALDT YAGTLQLEIS DQELQARLAK 
LATVKSIPVN GGYLSLFKEH VLQADEGCDF DFLVGCRGAE IPAHSH