Gene EcolC_1475 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1475
Symbol
ID	6067202
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1627463
End bp	1628929
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	52%
IMG OID	641600895
Product	mannitol dehydrogenase domain-containing protein
Protein accession	YP_001724465
Protein GI	170019511
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0246] Mannitol-1-phosphate/altronate dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0453772
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000115044
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGACAA TTGCCTCCGT TACGCTCCCG CATCATGTAC ACGCTCCACG CTACGATCGC 
CAGCAGTTGC AATCACGTAT CGTTCATTTT GGCTTTGGCG CCTTTCACCG CGCTCATCAG 
GCGTTACTGA CCGATCGTGT GCTGAATGCC CAGGGCGGCG ACTGGGGGAT CTGTGAAATC 
AGCTTGTTCA GCGGTGATCA ACTGATGAGC CAGCTCCGCG CACAGAACCA TTTATATACC 
GTGCTGGAGA AAGGTGCGGA CGGCAATCAG GTGATAATTG TCGGTGCCGT TCACGAATGC 
CTTAATGCAA AACTGGATTC CTTAGCGGCA ATTATTGAGA AATTTTGCGA GCCACAGGTG 
GCAATTGTTT CCCTGACGAT TACCGAAAAA GGCTATTGTA TTGACCCGGC CACCGGTGCA 
CTCGACACCA GTAATCCGCG GATTATTCAC GATCTACAAA CCCCTGAAGA ACCTCACTCC 
GCACCGGGTA TTCTCGTCGA AGCACTGAAA CGCCGCCGTG AGCGCGGCCT TACACCGTTT 
ACCGTGCTCT CCTGCGACAA TATTCCCGAC AATGGTCATG TGGTGAAAAA CGCGGTGCTG 
GGAATGGCAG AAAAACGTTC GCCAGAACTC GCCGGGTGGA TAAAAGAGCA CGTCAGTTTT 
CCGGGAACCA TGGTCGACCG CATTGTTCCG GCTGCAACCG ACGAATCACT GGTGGAAATC 
AGCCAGCATC TGGGGGTGAA TGATCCCTGC GCGATTAGCT GCGAACCGTT TATCCAGTGG 
GTGGTGGAAG ATAACTTCGT CGCTGGGCGT CCTGCCTGGG AAGTCGCAGG TGTACAAATG 
GTGAATGATG TCCTGCCATG GGAAGAGATG AAACTGCGGA TGCTTAATGG CAGCCACTCT 
TTTCTCGCTT ATCTGGGTTA CCTCTCAGGA TTCGCCCATA TCAGTGATTG CATGCAGGAT 
CGCGCATTTC GCCATGCCGC CAGAACATTA ATGCTGGATG AGCAAGCGCC GACACTGCAA 
ATTAAAGATG TCGATTTAAC ACAATATGCG GATAAGTTAA TTGCACGTTT TGCTAATCCG 
GCGCTGAAAC ATAAGACCTG GCAAATCGCG ATGGATGGCA GCCAGAAATT ACCGCAACGC 
ATGCTGGCAG GTATTCGCAT ACATCAGGGG CGCGAAACGG ACTGGTCGTT GCTGGCATTA 
GGCGTTGCAG GCTGGATGCG TTACGTCAGC GGCGTTGATG ATGCCGGAAA TGCCATTGAT 
GTTCGCGATC CGCTTAGCGA TAAAATTCGC GAACTTGTTG CGGGCAGCAG CAGTGAACAA 
CGCGTAACCG CCCTGCTTTC CCTGCGTGAA GTTTTCGGTG ATGATCTGCC AGATAACCCG 
CATTTTGTGC AGGCCATCGA ACAAGCCTGG CAACAAATCG TACAATTCGG CGCACATCAG 
GCGCTATTAA ACACCCTCAA AATTTAA

Protein sequence

MKTIASVTLP HHVHAPRYDR QQLQSRIVHF GFGAFHRAHQ ALLTDRVLNA QGGDWGICEI 
SLFSGDQLMS QLRAQNHLYT VLEKGADGNQ VIIVGAVHEC LNAKLDSLAA IIEKFCEPQV 
AIVSLTITEK GYCIDPATGA LDTSNPRIIH DLQTPEEPHS APGILVEALK RRRERGLTPF 
TVLSCDNIPD NGHVVKNAVL GMAEKRSPEL AGWIKEHVSF PGTMVDRIVP AATDESLVEI 
SQHLGVNDPC AISCEPFIQW VVEDNFVAGR PAWEVAGVQM VNDVLPWEEM KLRMLNGSHS 
FLAYLGYLSG FAHISDCMQD RAFRHAARTL MLDEQAPTLQ IKDVDLTQYA DKLIARFANP 
ALKHKTWQIA MDGSQKLPQR MLAGIRIHQG RETDWSLLAL GVAGWMRYVS GVDDAGNAID 
VRDPLSDKIR ELVAGSSSEQ RVTALLSLRE VFGDDLPDNP HFVQAIEQAW QQIVQFGAHQ 
ALLNTLKI