Gene Dd1591_4031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dd1591_4031
Symbol
ID	8119630
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dickeya zeae Ech1591
Kingdom	Bacteria
Replicon accession	NC_012912
Strand	-
Start bp	4550657
End bp	4552114
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	56%
IMG OID	644854408
Product	Tail Collar domain protein
Protein accession	YP_003006308
Protein GI	251791587
COG category	[R] General function prediction only
COG ID	[COG5301] Phage-related tail fibre protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACGA AATATACGGC CTTGCTTACC CAGGTGGGAG CAGACAGATT GGCTAATGCG 
ATCGCGCTGG GAAAACAACT GGAAATCGCC CGAATGGGCG TAGGGGATGG TGGTGGTGTA 
TTGCCAACGC CGGACGCAAC CCAGACTAAA TTGATCAATG AAAAACGTCG TGCCGCGCTT 
AATTCGTTGA GCATCGACCC TGCTAATGCC AATCAGATTA TTGCCGAACA AGTGATCCCG 
GAGAATGAAG GTGGATTCTG GCTGCGGGAA ATCGGCTTGT ATGATGCGGA TGATAATTTG 
ATTGCCGTAG CCAACTGTCC GGAAACCTAT AAACCACAGA TGCAGGAAGG ATCGGGCCGC 
GTGCAGACGG TGCGCATGAT TCTGGCTATT AGTCAGGCGC AAGCGGTATC GCTGAATATC 
GACCCGGCGG TAGTGCTGGC AACCCGTAAG TCGGTTGATG ACAAGGCGAT TGAGGTGAAA 
GCCTACGCCG ATGAACTGAT GGCGAAACAT CTCGCCGATG CGAATCCGCA TAAGCAGTAT 
GCGCCGCTGG CTAGCCCTGC GCTTACCGGG GTGCCGACCG CCCCCACGGC GGCGGCTGGA 
ACAAACACCA CGCAGTTGGC TACTACTGCA TTTGTCAAAA ACAATGCGGT GTGGGTATAT 
GGGTCTTTAG CTGGGCTGGA TTTGAATACG TTAACTGGCT CCCGCGCTGG GCGGTTCTGG 
CAGAATTTAA ATGCAGCAGC GACGGCGGCG CTCAATTACC CAGTTCAGTT TGCTGGCTCG 
CTGGATGTTG AAAAGAACAC GGCAGACAGC GCGGAGGGGT GCATTCAACG ATATACAACT 
TATGGCGGGG GGGCTCTCCC CCGTATGTTT ATTCGTTCGT ACAATGCGGG GAAACAAGTT 
TGGGGGGCAT GGCAGGAGCT GGCCTCATTA TCCAGCCCAA CTTTCACCGG CACGCCGACG 
GCGCCAACCG CAGAAGCAGG CTCTAACACT ACACAACTCG CAACGACCGC GTGGTTCGCA 
GCAGAGATTG CGGGTATCCC GCTTCCCTGG CCGCAGGCGG CAGTGCCAAC CGGTTGGCTG 
AAATGCAACG GTCAGGCATT CGATAAAAAC CGCTATCCAC GGCTGGCGCA GGTCTACCCG 
TCGGGCGTGC TGCCGGATCT GCGTGGCGAA TTTATTCGCG GCTGGGATGA TGGGAGGGGG 
GTGGATTCGG GGAGAGAAGT GCTCTCGCAG CAGAGAGGCT CTCTAATTAA CTACGATGGT 
CCAGATTCAG CACCGACCTC GGACTCGCTA CGGCTGTCAG TATCAGCAGC ACAAGCTGAT 
GCCGTCAGTG CGTCAGAGTA TGCCGGAGTG ATGCTGTCGT ACACGGCATA CAACATCACG 
ACAGTAAGTG CCGCTGGCTA TGTCGGCGCT ACCCGCCCTC GCAACATTGC CTTTAACTAT 
ATCGTGAGAG CAGCATAA

Protein sequence

MSTKYTALLT QVGADRLANA IALGKQLEIA RMGVGDGGGV LPTPDATQTK LINEKRRAAL 
NSLSIDPANA NQIIAEQVIP ENEGGFWLRE IGLYDADDNL IAVANCPETY KPQMQEGSGR 
VQTVRMILAI SQAQAVSLNI DPAVVLATRK SVDDKAIEVK AYADELMAKH LADANPHKQY 
APLASPALTG VPTAPTAAAG TNTTQLATTA FVKNNAVWVY GSLAGLDLNT LTGSRAGRFW 
QNLNAAATAA LNYPVQFAGS LDVEKNTADS AEGCIQRYTT YGGGALPRMF IRSYNAGKQV 
WGAWQELASL SSPTFTGTPT APTAEAGSNT TQLATTAWFA AEIAGIPLPW PQAAVPTGWL 
KCNGQAFDKN RYPRLAQVYP SGVLPDLRGE FIRGWDDGRG VDSGREVLSQ QRGSLINYDG 
PDSAPTSDSL RLSVSAAQAD AVSASEYAGV MLSYTAYNIT TVSAAGYVGA TRPRNIAFNY 
IVRAA