Gene Dd1591_3993 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dd1591_3993
Symbol
ID	8119592
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dickeya zeae Ech1591
Kingdom	Bacteria
Replicon accession	NC_012912
Strand	-
Start bp	4511000
End bp	4512595
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	57%
IMG OID	644854372
Product	extracellular solute-binding protein family 5
Protein accession	YP_003006272
Protein GI	251791551
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTACCA GAAGACGCTT TCTTGCCGGT TGTGCTACCG TGCCTGTCTT GTCCTGGCTT 
AATTTGAACA CCGCGTTCGC CGATACGCCG CCATCGATGC TGGTGATGGC GATGCAGCTT 
GATAACATGA CCAGTCTCGA CCCGCAGGAA GGGTTTGAGA CGGTGGGAAC CGAAATCATC 
GGTAACCTGT ACCAACGTTT GGTGATGCCG AACCCAGCCA ATCCGCAAGA GGTGATCGGC 
GATCTGGCCG CCAGTTGGGA AGTCGGCAAC GACAGCAAAA CCTTCACTTT CCATCTCAAT 
CCGCAAGCCA AATTCGCCGA CGGCACACCG GTGACCGCCG ACGACGCCGC CTTCTCGTTA 
CAACGCGCGG TTAAGCTGGA TAAAAGCCCG GCGTTCATCA TCAACCAGTT CGGTTTTACC 
AAAGACAACG TGGAGCAGCA CATTACCGCG CCGGATGAAA AAACGCTGGT GATAAGCCTC 
GACAAACCGG CGGCGGAAAC CTTCCTGCTG TATTGCCTGT CGGCCCCGGT GAGCAGCATC 
GTACAGAAAA AAGCCGCGCT GGCTAACCAG CAAAATAACG ATCTGGGTAA CCAGTGGTTG 
AAGCAGAATA GCGCCGGTTC CGGCCCTTTC TCGCTGGTGA GCTGGAAAGC CAGCGAAAGT 
ATTATCCTGC AGAAAAACGA TCACTTCCCG GCGGATAACG CCTTTAAGCG CGTGCTGCTC 
AAGCACATTG TCGACCCGTC CGCCCAGTTG CTGATGCTGC AAAAAGGGGA TGTAGATATC 
GCCCGCAACC TGACCACCGA GCAAATTCGC CCGCTGGTGA ACGACAGTAA CTACCATCTG 
GTGCGCCAGA GCATCGCCAG CGTGATGCTG CTGTCGTGCA ACACCGCCAA CGAGTTTCTG 
AAAAAGCCGC AGGTGTGGCA GGCCATCAAA TGGGCGCTGG ACTATGACGG CATTCAGAAA 
AATATTCTGC CGCTCACGCA CAAAGTCCAT CAGAGCTTCC TGCCGGGCGG CTTTCCGGCG 
GCGCTGAACG ATACCCCGTT TCATATGGAT GTCGCCAAAG CCAAAGCGTT GCTGAAAGAC 
GCCGGTTATC CGGATGGCTT CGACATTACG CTGGATCACT ACTCCGCCCA GCCGTACCCG 
GATATCGCGC AGGCAGTCCA GACCCAATTG GGTGCCATCG GCATCCGGGT GAAACTGATT 
GCGGCGGAAA ACCGTCAGGT ACTGACCAAA ATGCGTGCCC GCCAGCAGCA ACTGGCGCTG 
ACCGCGTGGG GCGCTGACTA TTTCGACCCG AACTCCAACG CCGAAGCCTT CTGCATCAAC 
ACCGACAACA GCGACGGCGC CCGCAACCGC ACGCTGGCGT GGCGCTGCAA CTGGTCGGAC 
GAAAAATTCA ATCAGTTGAC CGAACAGGCG CTGCACGAGC AGGACCCGGC CAAACGCATC 
GCGCTGTATG AAACTCTGCA ACGCAACCAC CGCGAGCAGA GCCCGTTCAC GCTGATGATG 
CAGGATGAGA AAACGCTGGC TTGCCGCAAG AATCTCAGCG GCGTCACCAT GACGGTGTTG 
AGCAAGGTGC CCTACCAGCA GGTGAAGAAA GCCTGA

Protein sequence

MVTRRRFLAG CATVPVLSWL NLNTAFADTP PSMLVMAMQL DNMTSLDPQE GFETVGTEII 
GNLYQRLVMP NPANPQEVIG DLAASWEVGN DSKTFTFHLN PQAKFADGTP VTADDAAFSL 
QRAVKLDKSP AFIINQFGFT KDNVEQHITA PDEKTLVISL DKPAAETFLL YCLSAPVSSI 
VQKKAALANQ QNNDLGNQWL KQNSAGSGPF SLVSWKASES IILQKNDHFP ADNAFKRVLL 
KHIVDPSAQL LMLQKGDVDI ARNLTTEQIR PLVNDSNYHL VRQSIASVML LSCNTANEFL 
KKPQVWQAIK WALDYDGIQK NILPLTHKVH QSFLPGGFPA ALNDTPFHMD VAKAKALLKD 
AGYPDGFDIT LDHYSAQPYP DIAQAVQTQL GAIGIRVKLI AAENRQVLTK MRARQQQLAL 
TAWGADYFDP NSNAEAFCIN TDNSDGARNR TLAWRCNWSD EKFNQLTEQA LHEQDPAKRI 
ALYETLQRNH REQSPFTLMM QDEKTLACRK NLSGVTMTVL SKVPYQQVKK A