Gene EcSMS35_2321 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2321
Symbol
ID	6145890
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	2351903
End bp	2353369
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	52%
IMG OID	641617195
Product	mannitol dehydrogenase family protein
Protein accession	YP_001744368
Protein GI	170680151
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0246] Mannitol-1-phosphate/altronate dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.312061
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.00251444
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATACAA TCGCCTCCGT TACGCTCCCG CATCATGTAC ACGCTCCACG CTACGATCGC 
CAGCAGTTGC AATCACGTAT CGTTCATTTT GGCTTTGGAG CCTTTCACCG CGCTCATCAG 
GCGTTACTGA CCGATCGTGT GCTGAATGCC CAGGGCGGCG ACTGGGGGAT CTGTGAGATC 
AGCTTGTTCA GCGGCGATCA ACTGATGAGC CAGCTCCGCG CACAGAACCA TTTATATACC 
GTGCTGGAGA AAGGTGCGGA CGGCAATCAG GCGATAATTG TCGGTGCCGT TCACGACTGC 
CTGAATGCAA AACTGGATTC CTTAGCGGCA ATTATTGAGA AATTTTGCGA GCCACAGGTG 
GCAATTGTTT CCCTGACGAT TACCGAAAAA GGCTATTGTA TTGACCCGGC CACCGGTGCA 
CTCGACACCA GCAATCCGCG GATTATTCAC GATCTTCAAA ATCCTGAAGA ACCTCACTCC 
GCGCCGGGTA TTCTCGTCGA AGCACTGAAA CGACGCCGTG AACGCGGCCT TGCACCGTTT 
ACCGTACTCT CCTGCGACAA TATTCCCGAC AATGGCCATT TGGTGAAAAA CGCGGTGCTG 
GGGATGGCGG AAAAACGTTC ACCAGAACTC GCCGGGTGGA TAAAAGAACA CGTCAGTTTT 
CCGGGAACCA TGGTCGACCG TATTGTTCCG GCAGCAACCG ACGAATCACT GGCGGAAATC 
AGCCAGCATC TGGGGGTGAA TGATCCCTGT GCGATTAGCT GCGAACCGTT TATCCAGTGG 
GTGGTGGAAG ATAACTTCGT CGCTGGGCGT CCTGCCTGGG AAGTCGCAGG TGTACAAATG 
GTGAATGATG TCCTGCCATG GGAAGAGATG AAACTGCGTA TGCTTAATGG CAGCCACTCT 
TTTCTCGCTT ATCTGGGTTA CCTCTCAGGA TTCGCCCATA TCAGTGATTG CATGCAGGAT 
CGCGCATTTC GCCATGCCGC CAGAACATTA ATGCTGGATG AGCAAGCGCC GACACTGCGG 
ATTAAAGATT TCGATTTAAC ACAATATGCG GATAAGTTAA TTGCACGTTT TGCTAACCCG 
GCGCTGAAAC ATAAGACCTG GCAAATCGCG ATGGATGGCA GCCAGAAATT ACCGCAACGT 
ATGCTGGCAG GTATTCGCAT ACATCTGGCG CGCGAAACGG ACTGGTCGTT GCTGGCATTA 
GGCGTTGCAG GCTGGATGCG TTACGTCAGC GGCGTTGATG ATGCCGGAAA TGCCATTGAT 
GTTCGCGATC CGCTTAGCGA TAAAATTTGC GAACTTGTTG CGGGCAGTAA CAGTGAACAA 
CGCGTAACCG CCCTGCTTTC TCTGCGTGAA GTTTTCAGTG ATGATCTGCC AGATAACCCG 
CATTTTGTGC AGGCAATCGA ACAAGCCTGG CAACAAATCG CACAATTCGG CGCGCATCAA 
GCGCTATTAA ACACCCTCAA AATTTAA

Protein sequence

MNTIASVTLP HHVHAPRYDR QQLQSRIVHF GFGAFHRAHQ ALLTDRVLNA QGGDWGICEI 
SLFSGDQLMS QLRAQNHLYT VLEKGADGNQ AIIVGAVHDC LNAKLDSLAA IIEKFCEPQV 
AIVSLTITEK GYCIDPATGA LDTSNPRIIH DLQNPEEPHS APGILVEALK RRRERGLAPF 
TVLSCDNIPD NGHLVKNAVL GMAEKRSPEL AGWIKEHVSF PGTMVDRIVP AATDESLAEI 
SQHLGVNDPC AISCEPFIQW VVEDNFVAGR PAWEVAGVQM VNDVLPWEEM KLRMLNGSHS 
FLAYLGYLSG FAHISDCMQD RAFRHAARTL MLDEQAPTLR IKDFDLTQYA DKLIARFANP 
ALKHKTWQIA MDGSQKLPQR MLAGIRIHLA RETDWSLLAL GVAGWMRYVS GVDDAGNAID 
VRDPLSDKIC ELVAGSNSEQ RVTALLSLRE VFSDDLPDNP HFVQAIEQAW QQIAQFGAHQ 
ALLNTLKI