Gene EcDH1_1597 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1597
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	1742404
End bp	1744566
Gene Length	2163 bp
Protein Length	720 aa
Translation table	11
GC content	53%
IMG OID
Product	capsular exopolysaccharide family
Protein accession	ACX39262
Protein GI	260448840
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.818894
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGAAA AAGTAAAACA ACATGCCGCT CCGGTAACGG GCAGTGATGA AATCGATATT 
GGTCGCCTGG TCGGCACCGT CATTGAAGCG CGCTGGTGGG TGATTGGCAT CACCACCGTA 
TTCGCCCTCT GTGCCGTGGT TTACACCTTC TTCGCCACGC CGATTTATAG TGCCGACGCA 
CTGGTACAAA TCGAGCAAAA CAGCGGCAAT TCGTTAGTGC AGGACATTGG TTCGGCATTA 
GCCAACAAAC CGCCTGCATC GGACGCCGAG ATCCAGTTGA TTCGTTCGCG TCTGGTGCTT 
GGTAAAACGG TGGACGATCT CGACCTCGAT ATTGCAGTGA GCAAAAACAC GTTCCCGATT 
TTCGGTGCGG GCTGGGATCG CCTGATGGGA CGTCAGAACG AGACGGTGAA AGTGACCACC 
TTTAACCGCC CGAAAGAGAT GGCGGATCAG GTGTTTACGC TTAATGTGCT GGACAACAAA 
AACTACACCC TGAGCAGCGA CGGCGGCTTT AGCGCCCGGG GGCAAGCGGG CCAGATGCTG 
AAAAAAGAAG GCGTCACGCT GATGGTTGAA GCCATTCACG CCAGCCCGGG CAGTGAGTTT 
ACCGTCACCA AATACTCCAC GCTGGGGATG ATCAACCAAC TGCAAAACAG CCTGACGGTA 
ACGGAGAACG GCAAAGACGC TGGCGTTTTG AGCCTGACTT ATACCGGTGA AGATCGTGAA 
CAGATCCGCG ACATTCTTAA CAGCATCGCC CGTAACTATC AGGAACAAAA TATTGAGCGC 
AAATCGGCGG AAGCGTCGAA AAGCCTCGCC TTCCTCGCGC AACAGTTACC GGAAGTACGT 
AGCCGCTTGG ATGTTGCCGA AAACAAACTG AATGCCTTCC GTCAGGATAA AGATTCTGTT 
GATCTGCCGC TGGAAGCAAA AGCGGTGCTC GATTCGATGG TGAACATCGA TGCGCAGTTG 
AACGAACTGA CCTTTAAAGA GGCGGAAATC TCCAAGCTGT ACACCAAAGT TCACCCGGCG 
TACCGCACGC TGCTGGAGAA ACGTCAGGCG CTGGAAGACG AAAAAGCCAA ACTTAACGGT 
CGCGTAACGG CGATGCCGAA AACCCAGCAG GAGATTGTCC GTCTGACCCG CGATGTCGAG 
TCTGGTCAGC AGGTTTATAT GCAACTGCTG AATAAAGAGC AGGAGCTGAA AATCACCGAG 
GCCAGCACCG TCGGCGATGT GCGCATTGTT GACCCGGCAA TCACTCAGCC TGGCGTGCTG 
AAACCGAAGA AAGGGCTGAT TATCCTCGGC GCGATTATCC TTGGCCTGAT GCTTTCTATC 
GTGGGTGTGC TGCTGCGCTC GTTGTTTAAT CGCGGCATTG AAAGCCCGCA AGTACTGGAA 
GAACACGGTA TTAGCGTCTA TGCCAGCATC CCGCTGTCGG AATGGCAGAA AGCGCGTGAT 
AGCGTCAAAA CCATCAAAGG GATTAAACGC TATAAACAGA GCCAGCTACT GGCGGTGGGG 
AATCCAACCG ATCTGGCGAT TGAAGCCATC CGTAGTCTGC GTACCAGTTT GCACTTCGCG 
ATGATGCAGG CACAGAACAA TGTGTTGATG ATGACCGGGG TTAGCCCGTC AATTGGTAAA 
ACCTTTGTCT GCGCCAACCT GGCGGCGGTG ATCAGCCAGA CCAATAAACG CGTGTTGTTG 
ATCGACTGCG ATATGCGCAA AGGCTACACC CACGAGCTGT TGGGCACTAA TAACGTTAAT 
GGCCTGTCGG AAATTCTGAT TGGTCAGGGC GATATTACTA CCGCTGCTAA ACCGACCTCT 
ATTGCCAAAT TTGACCTGAT CCCGCGCGGT CAGGTGCCGC CAAATCCTTC TGAACTGTTG 
ATGAGCGAAC GCTTTGCCGA ACTGGTGAAC TGGGCGAGTA AAAACTATGA CCTGGTGTTG 
ATTGATACGC CGCCGATTCT GGCAGTGACC GATGCGGCAA TTGTTGGTCG TCATGTCGGA 
ACCACGTTAA TGGTGGCGCG TTATGCGGTC AACACATTGA AAGAAGTGGA AACCAGTCTG 
AGCCGCTTTG AGCAAAACGG TATTCCGGTG AAAGGGGTGA TTCTGAACTC CATCTTCCGC 
CGCGCCAGCG CGTATCAGGA TTATGGCTAT TACGAATACG AATATAAGTC GGATGCGAAA 
TAA

Protein sequence

MTEKVKQHAA PVTGSDEIDI GRLVGTVIEA RWWVIGITTV FALCAVVYTF FATPIYSADA 
LVQIEQNSGN SLVQDIGSAL ANKPPASDAE IQLIRSRLVL GKTVDDLDLD IAVSKNTFPI 
FGAGWDRLMG RQNETVKVTT FNRPKEMADQ VFTLNVLDNK NYTLSSDGGF SARGQAGQML 
KKEGVTLMVE AIHASPGSEF TVTKYSTLGM INQLQNSLTV TENGKDAGVL SLTYTGEDRE 
QIRDILNSIA RNYQEQNIER KSAEASKSLA FLAQQLPEVR SRLDVAENKL NAFRQDKDSV 
DLPLEAKAVL DSMVNIDAQL NELTFKEAEI SKLYTKVHPA YRTLLEKRQA LEDEKAKLNG 
RVTAMPKTQQ EIVRLTRDVE SGQQVYMQLL NKEQELKITE ASTVGDVRIV DPAITQPGVL 
KPKKGLIILG AIILGLMLSI VGVLLRSLFN RGIESPQVLE EHGISVYASI PLSEWQKARD 
SVKTIKGIKR YKQSQLLAVG NPTDLAIEAI RSLRTSLHFA MMQAQNNVLM MTGVSPSIGK 
TFVCANLAAV ISQTNKRVLL IDCDMRKGYT HELLGTNNVN GLSEILIGQG DITTAAKPTS 
IAKFDLIPRG QVPPNPSELL MSERFAELVN WASKNYDLVL IDTPPILAVT DAAIVGRHVG 
TTLMVARYAV NTLKEVETSL SRFEQNGIPV KGVILNSIFR RASAYQDYGY YEYEYKSDAK