Gene Dd1591_3900 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dd1591_3900
Symbol
ID	8118865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dickeya zeae Ech1591
Kingdom	Bacteria
Replicon accession	NC_012912
Strand	-
Start bp	4412118
End bp	4413449
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	57%
IMG OID	644854279
Product	proline dipeptidase
Protein accession	YP_003006179
Protein GI	251791458
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.022198
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAACGC TGACTTCTTT GTATCATCAA CATGTGGCGA CTCTGCAGCA ACGCACGCAG 
GCGGTTCTGG CACGGCATAA TCTGGATGCC TTATTGATCC ACTCCGGTGA GTTGATGATG 
GCGTTTCTGG ATGATCATGC TTATCCGTTC AAAGTTAACC CGCAGTTCAA AGCCTGGCTG 
CCGGTGACGC AAGTGCCGAA CTGCTGGCTG TGGGTGGATG GAGTCAATAC GCCGAAGCTG 
TGGTTCTACT CCCCCGTTGA TTACTGGCAT AACGTGGCGC CGGTGCCGGA CAGTTTTTGG 
ACCACATCGC TGGACATCCA GGTACTGCGC AAGGCCGATG ACATCGTCCG GCAATTGCCG 
GTTCAACGCC AGCGTGTCGC TTACATCGGT TCTGCGCCGC AACGGGCGTT GAATCTGGGC 
GTGGCGTCGG AACACATCAA CCCGAAAGGC GTGCTGGATT ATCTGCATTA CTACCGCGCC 
TACAAAACGG ATTACGAACT GGCCTGCCTG CGTGAAGCGC AGAAAACGGC GGTGGTCGGC 
CACCACGCCG CATACGAAGC GTTCCAGTCC GGCATGAGCG AATTTGACAT CAATCTGGCG 
TACCTGACCG CCACCGGTCA CCGTGATACC GATGTGCCTT ATGGCAATAT CGTCGCTCTC 
AACGAGCACG CGGCGGTGCT GCACTATACT CAACTTGAAC ACCGGGTGCC GATGGAAATG 
CGCAGTTTCC TGCTGGATGC CGGCGCAGAA TATAACGGCT ATGCGGCGGA CATTACCCGT 
ACCTATGCCG CGCAGCATGA TAATGACTAT GCTGCGCTGG TAAAAGACCT GAACCGCGAG 
CAACTGGCGC TGATAGATAC CCTGAAGGCC GGCGTGCGTT ATACCGACTA CCATTTGCAG 
ATGCATCGCC GGGTGGCGGC GTTGCTTAAA CGTCATCAAC TGGTGACCGG GCTGAGCGAA 
GAAGCGATGG TGGAACAGAG CGTGACCTCG CCGTTCCTGC CGCACGGTCT GGGCCATCCG 
CTCGGTTTGC AGGTGCACGA CGTCGGCGGA TTTATGCAGG ACGACGCCGG CACGACGCTG 
CCTGCGCCAT CAGCCCATCC CTACCTGCGC TGTACCCGGA TTCTGGAGCC GCGCATGGTG 
CTGACTATCG AACCGGGTAT CTATTTCATC GATTCGTTGC TTGAGCCCTG GCGTCAGGGC 
GAGCTACGCC AGCATTTCAA CTGGCAGAAG CTGGATGCGT TGCGTCCGTT CGGCGGTATT 
CGTATTGAAG ACAATATCGT GGTTCATGAC AAACGCATCG AAAACCTGAC CCGCGCGCTT 
GATCTGGCCT GA

Protein sequence

METLTSLYHQ HVATLQQRTQ AVLARHNLDA LLIHSGELMM AFLDDHAYPF KVNPQFKAWL 
PVTQVPNCWL WVDGVNTPKL WFYSPVDYWH NVAPVPDSFW TTSLDIQVLR KADDIVRQLP 
VQRQRVAYIG SAPQRALNLG VASEHINPKG VLDYLHYYRA YKTDYELACL REAQKTAVVG 
HHAAYEAFQS GMSEFDINLA YLTATGHRDT DVPYGNIVAL NEHAAVLHYT QLEHRVPMEM 
RSFLLDAGAE YNGYAADITR TYAAQHDNDY AALVKDLNRE QLALIDTLKA GVRYTDYHLQ 
MHRRVAALLK RHQLVTGLSE EAMVEQSVTS PFLPHGLGHP LGLQVHDVGG FMQDDAGTTL 
PAPSAHPYLR CTRILEPRMV LTIEPGIYFI DSLLEPWRQG ELRQHFNWQK LDALRPFGGI 
RIEDNIVVHD KRIENLTRAL DLA