Gene PC1_3371 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PC1_3371
Symbol
ID	8134351
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pectobacterium carotovorum subsp. carotovorum PC1
Kingdom	Bacteria
Replicon accession	NC_012917
Strand	+
Start bp	3801774
End bp	3803108
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	58%
IMG OID	644866672
Product	glycoside hydrolase family 28
Protein accession	YP_003018923
Protein GI	253689733
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5434] Endopolygalacturonase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCACT CTATCCAGTC ATACTCCCCC GCCGCCGACG GCGTCACACC GGATACCGCC 
ATTTTTCAGC AGGCTATCGA CAGGATTGCG GCACAGGGCG GCGGCACCTT GACGGTAGAA 
CCGGGGCGCT ATCTGTTAGG GGGCTTGCTG CTGCCTTCCA ATTTTTGCCT GCAACTGGAG 
GCGGGGGCTG AGCTCATCGT CAGCGGCGAC TATGAGCAGT TTACGCAGGC TACCACCATC 
AGCATGGCCG AGCTGTCACA TCGGGCGTTT CTTTATGCTT ACCAACAGCG CAATATCACG 
ATCTGCGGTC AGGGTAAGAT CATGGGAAAT GCCGACGCCT ATTTCTCGGT GGAACCCGAC 
GCTCAAGGCT ATCGCCTGCC TGCGCAACAT CGCCCACGCA TTGTGGTTTT TGAGGATTGC 
GAACACATCC GCCTGTGTGA CTTTACGATT GAACACGCGC CAATGTGGAC CGTGCATTTG 
GTCAGCTGTC GTCACGTCAT CGTCGAACGC CTGACGATTG ATAACGATCT GAGCATGGCG 
AATACCGATG CGCTGGATCT CGATAGCTGC CAGCAGGTAC AAATCAGCAA CTGCTCGCTG 
AGCGCCGCCG ACGATGCACT GTGCATCAAA ACCACCAATA AGCCGCCACA TCTGCAACGT 
AAGGTGCAGC AGGTCGTTAT CAGCAATTGC CTGTTGCGCT CCAAGAGCTG TGCGCTGAAG 
GTCGGCACCG AAACCTTTGC CGACATTGAA GATATCTCCG TCAGCAACTG TGCCATTTAC 
GATACCAACC GCGCGATCGG CCTGATCTCC CGCGATGGTG GCACGTTCCG ACGTTTGCAG 
TTCAGCAACA TCACATTCCA GTGTGTCGCC GCACATCCGT GCCACTGGGG CAAAGCCGAT 
CCGATCTTTA TCTCCGTACG CTATCGCGAT CCCGCCATCG AACCGGGCCG GATCGAAGCG 
GTGCAATTTT CGCAGATCGC GGGGATCAGC GAGGGGGCGA TTAACCTGCA CAGCACGCCC 
GCAGGCTACA TTCGTGACAT CCATTTCCAT GCCGTGCACC TCGAACAGCG GCAGAGCGAC 
TCGCCGGAAC AGGGCATGTA CGATGTGCGT CCGCCCTGCA ACCCGGAACG CCCTACGGGC 
ATGGGGTTAG ACAATGCGTA TCGGGTCGAT CCCATTACCG GGCGCGCATT CGGCGTTGAG 
CACTACCCAG GCGGCATGCC CGCATTATTT GCTCGTGGCG TCCTGAACCT GACCACCAGC 
CACATGACGA TCCACCGTCC CGATCCGCTC CCTTCAGGCT GGCATCACGC CACGATCGTG 
CAGTTGGAAG AATAA

Protein sequence

MKHSIQSYSP AADGVTPDTA IFQQAIDRIA AQGGGTLTVE PGRYLLGGLL LPSNFCLQLE 
AGAELIVSGD YEQFTQATTI SMAELSHRAF LYAYQQRNIT ICGQGKIMGN ADAYFSVEPD 
AQGYRLPAQH RPRIVVFEDC EHIRLCDFTI EHAPMWTVHL VSCRHVIVER LTIDNDLSMA 
NTDALDLDSC QQVQISNCSL SAADDALCIK TTNKPPHLQR KVQQVVISNC LLRSKSCALK 
VGTETFADIE DISVSNCAIY DTNRAIGLIS RDGGTFRRLQ FSNITFQCVA AHPCHWGKAD 
PIFISVRYRD PAIEPGRIEA VQFSQIAGIS EGAINLHSTP AGYIRDIHFH AVHLEQRQSD 
SPEQGMYDVR PPCNPERPTG MGLDNAYRVD PITGRAFGVE HYPGGMPALF ARGVLNLTTS 
HMTIHRPDPL PSGWHHATIV QLEE