Gene Dd1591_3669 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dd1591_3669
Symbol
ID	8117500
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dickeya zeae Ech1591
Kingdom	Bacteria
Replicon accession	NC_012912
Strand	-
Start bp	4156219
End bp	4157529
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	54%
IMG OID	644854043
Product	putative 5-methylcytosine restriction system component
Protein accession	YP_003005956
Protein GI	251791235
COG category	[V] Defense mechanisms
COG ID	[COG4268] McrBC 5-methylcytosine restriction system component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATGAGG TTATCTCGGT GTTTGAATAC GGCTGTGTCG GCGCGGCTCC GGTTCGGCTG 
GCTGATGTCG CCGCGGTTCC ACCGGCGGTA TTCGACTATC TGGAATCGCT GGCGCTGGAT 
GAACAGGGCT GCCCGTTCCT GCGTCTGACA TCACGCAAAG GGCATCGGCT GATTCAGGTG 
CAGAACTATG CCGGGGTGCT TGCCACGCCC TTTGGCGTGC AACTGGAGAT CTTGCCTAAA 
ATTGGGCGGA CGTCCCCCCC TGAACAAGCA CGGCATGTGT TGCTGGCTAT GCTGGCGGTA 
TTACCGGATT TTCGGCATAT CGAGACAGAG CAGGCGTTGG TGCAGGTGCA GCGGATGACG 
CTGCTGGAAA TCTTCATCAG CCAGTTTTTG CAGAGCGTCA GCCAACTGAT CAGGCAAGGG 
TTGCGCTCCG ATTATGTGAG CCAACAAGGC AACCTGCCGT TTATCAAAGG TAAGCTGTTG 
CTGCCTGAGC AGTTGCGCCG CAATAATGTG AATCGGCATA AGTTCTGGGT TGAATATGAA 
GACTATTTAC CGGACTGTCC GGCAAATAGG TTATTACATT CGGCCCTTAA TTTGGTCAGC 
CAGTGGCGGT TGTCGTCGGA AAATCAGCGT GAATGCCGGA TGCTGCGGTT TGTATTTGAT 
GGCATTCCAC CTAGCCGGGA TATCGACAGT GATATCAGCA GGCTGCGTGT GGACCGCAAT 
ATGGCGCATT ATCAGGCACC GCTGGCTTGG GCGAAACTGA TTCTGACCGG GATGAGCCCG 
CGAACGTCGG CGGGCAGCGA GGGGGCGATA TCGCTGTTAT TTCCGATGGA AGCCGTGTTT 
GAGGCGTTTG TGGCGCAAAC GTTGTTGGAA GAGATTCCGC CCGACCAGCA TCTGAAAGCT 
CAGGTGGCGG AGCAGACCTT GGTAAGTTAC GCGGGTAGGG CGCGGTTCAA ATTACAGCCT 
GATTTATTGC TCCAGTCACG CCACCCTGCC TGCAATCTGG CGGTGTTGGA TACCAAATGG 
AAGTTGATCC GTGAACGACA GTGGCTCCGC GATGGGCAAC AAGGGGACAG GCTCCGTGGT 
TTGTCCGAAT CCGATTTTTA TCAGATGTTT GCTTATGGGC AGCGCTATCT GGCCGATAAG 
GGTGATATGT ACCTGATTTA TCCCGAGCAC GATGAATTTA CCCAGCCGCT CCCATCCCCT 
TTTATTTTTT CGGAAACGTT ACGGTTGTGG GTGGTGCCGT ATCGTATTTC GGCATTAGAC 
GGGCAGAGAA TGCAGTGGCC ACATCGAGAA TACAAGGCAG CGGTAAATTA A

Protein sequence

MHEVISVFEY GCVGAAPVRL ADVAAVPPAV FDYLESLALD EQGCPFLRLT SRKGHRLIQV 
QNYAGVLATP FGVQLEILPK IGRTSPPEQA RHVLLAMLAV LPDFRHIETE QALVQVQRMT 
LLEIFISQFL QSVSQLIRQG LRSDYVSQQG NLPFIKGKLL LPEQLRRNNV NRHKFWVEYE 
DYLPDCPANR LLHSALNLVS QWRLSSENQR ECRMLRFVFD GIPPSRDIDS DISRLRVDRN 
MAHYQAPLAW AKLILTGMSP RTSAGSEGAI SLLFPMEAVF EAFVAQTLLE EIPPDQHLKA 
QVAEQTLVSY AGRARFKLQP DLLLQSRHPA CNLAVLDTKW KLIRERQWLR DGQQGDRLRG 
LSESDFYQMF AYGQRYLADK GDMYLIYPEH DEFTQPLPSP FIFSETLRLW VVPYRISALD 
GQRMQWPHRE YKAAVN