Gene PSPTO_4101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PSPTO_4101
Symbol	hopAK1
ID	1185781
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pseudomonas syringae pv. tomato str. DC3000
Kingdom	Bacteria
Replicon accession	NC_004578
Strand	+
Start bp	4621223
End bp	4622890
Gene Length	1668 bp
Protein Length	555 aa
Translation table	11
GC content	57%
IMG OID	637395447
Product	type III helper protein HopAK1
Protein accession	NP_793862
Protein GI	28871243
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3866] Pectate lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACGA TCAACAGAAA CATCTACCCC GTCTCCGGGA TTTCTGCGCA GGATGCCCCT 
GTACAAACTG ATCAGCTCCA GCCGCAAGGC CAGGGCATCA GGCCGGGGCA CAATAGCAAC 
CTGATCGACT TCGGACTGAT ACAGCAGGCC AATGGTCCGC ACTCATCGCT GAACACATCG 
AGCTCCAGAA TTCAGCCGAC TGACACCAGC ACATCCTCAA ACAGGCTGGG GGGTAATGGC 
GATCAGTTAC TGAACAAACT CGTGGAAGCG ATCCGTAATA TCCTCAACAA CCTGCTCTCT 
CTGCTGGAAG GCAATCAACA CCAGGGCTCT TCGCCTGCAC AGACCCAGCG TGAACAGACG 
CCGACGTCCA CTCAATCGCA CGCTTCGCCT TCCTCGTCGT CTTCATCTTC GCCGTCGACA 
TCCTCCCAGT CTTCACCCTC AGTGCCTTCA ACGCCTCAGG GCAACGCAGA AAAACCGTTT 
GTGGTGCAGA GCGATCATCC GGCGGAAAAA CCGGTATCGC TGCAGAGAAC CTCAGAGCCA 
ACGTCTGTGA CGCCGCCACA AACACCACCG CAGGCTGTCG AGCGAAACAG CATTACCCCG 
GACAAGGCAC CGGCCAAACC CGAAGCGGTA AAGCCGGCAG TGGTCAACGA CCCGGTGCTG 
CCGAAAACCT CGATCCCTGC CGCCGCCAAG CCTGACAGCA CGGTGACCGC CGCAAAACAC 
GCGACGCCCG CTGCCCGTGG CCAGGGCGCT GACATGTCCG GCATGATCGG TTTTGCCAAG 
GAAGCCAATA CCACCGGGGG CAACAACGGC GAAGTGGTCA CCGTGAACAC GGTTGCCGAC 
CTCAAGAAGT ACATGGAGGA CGACAAAGCC CGCACCGTCA AGCTGGGGGC CAACCTGTCT 
GCCGACAGTA AAGTGTCGAT AAATTTCGGG GCCAACAAAA CCCTGCTGGG CACCGATAAA 
GGCAACACCC TGCACAACAT CTATCTGGCC AGCGGCAAGA CCGCCAGCAA CGACATTTTC 
CAGAATCTGA ACTTCAACCA CGACGCCCGT TACCGTGAAA ACGGCGACAT GCAGATGTTC 
ATCAGCAGCG GTCAGAAATA CTGGATCGAC CACATCACCG CTACCGGAAC CAAGGATCAG 
AACCCCAAAG GTCTGGATAA ACTGCTCTAC GTGGGCGGCA AGGCAGATAA CGTCAGCCTG 
ACCAATTCGA AATTCCAGAA CAACGAGTAT GGCGTGATTC TCGGTCAGCC GGACGACTCG 
GCAGCCGCCA AAGCCGAGTA CAAGGGCTAC CCACGGATGA CAATCGCCAA CAACGTGTTC 
AGCAACCTCG ATGTCCGCGG GCCCGGTCTG TTTCGTCAGG GCCAATTTGA CGTAGTTAAC 
AACTCGATCG ACAAATTCCA CCTCGGTTTC ACTGCGACCG GGAACGCTAC CATCCTGTCG 
CAGGCCAACT ATTTCAGCAA CGGTGTCGAT GTTTCCAACA AGGCAAGTAA TAGCGGCGTG 
CTGGATGACT ACGGCGATGC GCACTTCAAA GACATCGGCA GTAACGTCAG TTTCACTCAG 
AAATCGCCGG TTACCGCCTG GACACCGAGC TACAACCGGG ACGTGAAAAC AGCCGAAGCA 
GCCAGAGCCT ATGACCTGGC CAATGCGGGT GCACAGGTCG TGAAATAA

Protein sequence

MNTINRNIYP VSGISAQDAP VQTDQLQPQG QGIRPGHNSN LIDFGLIQQA NGPHSSLNTS 
SSRIQPTDTS TSSNRLGGNG DQLLNKLVEA IRNILNNLLS LLEGNQHQGS SPAQTQREQT 
PTSTQSHASP SSSSSSSPST SSQSSPSVPS TPQGNAEKPF VVQSDHPAEK PVSLQRTSEP 
TSVTPPQTPP QAVERNSITP DKAPAKPEAV KPAVVNDPVL PKTSIPAAAK PDSTVTAAKH 
ATPAARGQGA DMSGMIGFAK EANTTGGNNG EVVTVNTVAD LKKYMEDDKA RTVKLGANLS 
ADSKVSINFG ANKTLLGTDK GNTLHNIYLA SGKTASNDIF QNLNFNHDAR YRENGDMQMF 
ISSGQKYWID HITATGTKDQ NPKGLDKLLY VGGKADNVSL TNSKFQNNEY GVILGQPDDS 
AAAKAEYKGY PRMTIANNVF SNLDVRGPGL FRQGQFDVVN NSIDKFHLGF TATGNATILS 
QANYFSNGVD VSNKASNSGV LDDYGDAHFK DIGSNVSFTQ KSPVTAWTPS YNRDVKTAEA 
ARAYDLANAG AQVVK