Gene Dd1591_1529 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dd1591_1529
Symbol
ID	8117409
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dickeya zeae Ech1591
Kingdom	Bacteria
Replicon accession	NC_012912
Strand	-
Start bp	1747386
End bp	1748666
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	45%
IMG OID	644851922
Product	Cellulase
Protein accession	YP_003003863
Protein GI	251789142
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2730] Endoglucanase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTATTT TTGATCTGGA CAAGAAAAAC ACCTCCAATA AAAAACACTA CTCTTCACGT 
AAAAGCCTGT ATTTTTCCGG TATTTTCTTA GGATTAAGTA TTACCTGTCT CTCCGGTAGT 
GCCTGGGCCA GTGTTGAACC CCTTTCCGTC AGCGGTAATA AAATCTATGC GGGCGAAAAA 
GCTCAGAGCT TCGCCGGCAA TAGCCTATTC TGGAGTAATA ATGGCTGGGG TGGTGAAAAA 
TTCTATACTG CCGATACGGT TGCCTCACTA AAAAAAGACT GGGGTTCCAG TATTGTTCGT 
GCGGCGATGG GGGTACAAGA CGCCGGTGGT TATCTCCAGG ACCCAGCCGG CAACAAAGCT 
AAAGTTGAAA AAGTTGTGGA TGCGGCTATC GCCAACGACA TGTATGTGAT TATTGACTGG 
CATTCACACT CAGCAGAAAA TAACCGTAAC GAAGCGATTA GCTTCTTCCA GGAAATGGCC 
AGAAAGTATG GCAAAAATCC TAATGTTATT TATGAAATCT ACAATGAGCC ACTTCAGGTT 
TCATGGAGTA ACACAATCAA ACCTTATGCA GAAGCAGTTA TTTCCGCTAT CAGGGCGATT 
GATCCGGATA ATCTCATTAT TGTCGGCACA CCCAGTTGGT CACAAAACGT AGACGAAGCC 
TCACGAGATC CAATCAACGC CAATAATATT GCCTATACAT TACACTTCTA TGCCGGAACA 
CATGGCGAGT CGTTACGCAA TAAAGCCCGC CAGGCGCTAA ATAATGGTAT CGCTCTCTTT 
GTTACCGAGT GGGGAGCAGT CAATGCCGAT GGTAATGGTG GGGTAAATCA AACAGAAACA 
GATGCCTGGG TAACATTTAT GAAGGATAAC AATATCAGCA ACGCTAACTG GGCGTTGAAT 
GATAAAAATG AAGGGGCATC TACTTATTAT CCTGATTCCA AAAACCTTAC CGAATCGGGC 
AAGAAAGTAA AATCGATCAT TCAAAATTGG CCTTATAAAA TCAACGGCAC ATCCAGTACC 
ACAACTGAAC CATCAACCGA ACCCACACCA ACGCCTACCA CAGACGAGCC GGTGACGACG 
GATGAGCCGG CAACAACAAA CTGTTCGAAT ACCAATGTGT ATCCCAATTG GGTCAGTAAG 
GACTGGGCTG GTGGGCAACC AAATCATAAT GAAGCGGGTC AATCGATCGT CTACAAAGGC 
AATCTCTATA CTGCAAACTG GTACACGACC TCTACCCCTG GCAGCGACTC CTCATGGACG 
TTGGTCGGTA GCTGCAATTG A

Protein sequence

MPIFDLDKKN TSNKKHYSSR KSLYFSGIFL GLSITCLSGS AWASVEPLSV SGNKIYAGEK 
AQSFAGNSLF WSNNGWGGEK FYTADTVASL KKDWGSSIVR AAMGVQDAGG YLQDPAGNKA 
KVEKVVDAAI ANDMYVIIDW HSHSAENNRN EAISFFQEMA RKYGKNPNVI YEIYNEPLQV 
SWSNTIKPYA EAVISAIRAI DPDNLIIVGT PSWSQNVDEA SRDPINANNI AYTLHFYAGT 
HGESLRNKAR QALNNGIALF VTEWGAVNAD GNGGVNQTET DAWVTFMKDN NISNANWALN 
DKNEGASTYY PDSKNLTESG KKVKSIIQNW PYKINGTSST TTEPSTEPTP TPTTDEPVTT 
DEPATTNCSN TNVYPNWVSK DWAGGQPNHN EAGQSIVYKG NLYTANWYTT STPGSDSSWT 
LVGSCN