Gene EcolC_1614 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1614
Symbol
ID	6065807
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1795759
End bp	1796925
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	44%
IMG OID	641601029
Product	nucleotide sugar dehydrogenase
Protein accession	YP_001724599
Protein GI	170019645
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1004] Predicted UDP-glucose 6-dehydrogenase
TIGRFAM ID	[TIGR03026] nucleotide sugar dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.812894
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATCA CCATTTCCGG TACTGGCTAT GTAGGCTTGT CAAACGGGCT TCTAATCGCA 
CAAAATCATG AGGTTGTGGC ATTAGATATT TTACCGTCAC GTGTTGCTAT GCTGAATGAT 
CGGATATCTC CTATTGTTGA TAAGGAAATT CAGCAGTTTT TGCAATCAGA TAAAATACAC 
TTTAATGCCA CATTAGATAA AAATGAAGCC TACCGGGGGG CTGATTATGT CATCATCGCT 
ACTCCAACCG ACTATGATCC TAAAACTAAT TATTTCAATA CATCCAGTGT AGAATCAGTA 
ATTAAAGACG TAGTTGAGAT AAATCCTTAT GCGGTTATGG TCATCAAATC AACGGTTCCC 
GTTGGTTTTA CCGCAGCGAT GCATAAGAAA TATCGTACTG AAAATATTAT ATTCTCACCC 
GAATTTCTCC GTGAGGGTAA AGCCCTTTAC GATAACCTTC ATCCGTCACG TATTGTCATC 
GGTGAGCGTT CAGAACGCGC AGAACGTTTC GCTGCGTTAT TACAGGAAGG CGCGATTAAG 
CAAAATATCC CAACCCTGTT TACCGACTCC ACTGAAGCAG AAGCGATTAA ACTTTTCGCT 
AATACCTATC TGGCGATGCG CGTAGCATAC TTTAATGAAC TGGATAGCTA TGCAGAAAGT 
TTAGGTCTGA ATACTCGCCA GATTATCGAA GGCGTTTGTC TCGATCCGCG TATTGGCAAC 
CATTACAACA ATCCGTCGTT TGGTTATGGT GGTTATTGTC TGCCGAAAGA TACCAAGCAG 
TTACTGGCGA ACTACCAGTC TGTGCCGAAT AACCTGATCT CGGCAATCGT AGACGCTAAC 
CGCACGCGTA AAGATTTTAT TGCCGATGCC ATTTTGTCAC GCAAACCGCA AGTGGTGGGT 
ATTTATCGTC TGATTATGAA GAGCGGTTCA GATAACTTTC GCGCGTCTTC CATTCAGGGG 
ATTATGAAGC GTATCAAGGC GAAAGGCGTT GAAGTGATCA TCTACGAACC GGTGATGAAA 
GAAGACTTAT TCTTCAACTC TCGCCTGGAA CGTGATCTCG CCACCTTCAA ACAACAAGCC 
GACGTCATTA TTTCCAACCG TATGGCAGAA GAGCTTAAGG ATGTGGCAGA CAAAGTCTAC 
ACCCGCGATC TCTTTGGCAG TGACTAA

Protein sequence

MKITISGTGY VGLSNGLLIA QNHEVVALDI LPSRVAMLND RISPIVDKEI QQFLQSDKIH 
FNATLDKNEA YRGADYVIIA TPTDYDPKTN YFNTSSVESV IKDVVEINPY AVMVIKSTVP 
VGFTAAMHKK YRTENIIFSP EFLREGKALY DNLHPSRIVI GERSERAERF AALLQEGAIK 
QNIPTLFTDS TEAEAIKLFA NTYLAMRVAY FNELDSYAES LGLNTRQIIE GVCLDPRIGN 
HYNNPSFGYG GYCLPKDTKQ LLANYQSVPN NLISAIVDAN RTRKDFIADA ILSRKPQVVG 
IYRLIMKSGS DNFRASSIQG IMKRIKAKGV EVIIYEPVMK EDLFFNSRLE RDLATFKQQA 
DVIISNRMAE ELKDVADKVY TRDLFGSD