Gene Dtpsy_0844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtpsy_0844
Symbol
ID	7383539
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidovorax ebreus TPSY
Kingdom	Bacteria
Replicon accession	NC_011992
Strand	+
Start bp	872141
End bp	873331
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	64%
IMG OID	643654156
Product	Zonular occludens toxin
Protein accession	YP_002552322
Protein GI	222110058
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGCCCT TGCGCTCTCT GCGCCGCCAG CGCGGCTTTT TGTACCTTAC TACTGGCGGC 
AACGGCACCG GCAAGACGCT GTTTACGCTC TATGACGTGC GCAAGCTCCA GCTGGAGACT 
GGTCGCCCGG TGTACTTTTC TGGCTTTGAG GCCAAGCAGC CGCTGCTGGA TTTTGGGTGG 
CAACCCTTTG AGCCGGAGTG CTGGCAGGAT CTGCCTGACG GGTCGATCTG CTTGGTGGAC 
GAGTGTCAGA AAGTCATGCC TGTGCGCGGC ACCGGCAAGC CGCCGGAGTG GATTGCGGCT 
ATCGCCGAGG TGCATCGCAA ACGCGGCTTT GACTTCTTCC TGATCACGCA ACACCCGCTT 
AATTTCGATT CGTTCGTCCG TCGTCTGGTG GCCGCGCCTG GTTGGCACCG GCACTTCAAG 
GCGAGCTCCA TGGGTGACAG CTCCAATGAG CTGAAATGGT CCTCGGTTAA GGACAACCCG 
CAGGTGGCCA ATAGCTCGGC CATGGGCGAG GTGACATCCC GCGCGTTCCC TCGGGAGGTG 
TATGACTGGT ACGCCTCGTC CAGCCTGCAC ACGGCGCGCA AGCGGATCCC GCTGAAGGTC 
TGGGGCGCCA TCGCGGGCGT CATTGCGGCG TTCGGCATGG TCGGTTTCGC CGTGTGGCAC 
TTCCTCGGCT ACACCGGGGC GCCAGCGGCT GCTAAGCCGG CAGCTGCCCC GGAGGCGTCC 
GCGCTGTCAA AGATGCTGAC CCCTGCTGCA GCGTCTGGTG TCGGTAGCTC GGAGCGGCAG 
CCGCTGACGG TGGCTGAGTA CGTCGAGCAG CGCAAGCCGC GCCTGCCTGG GTTCCCCAAC 
ACGGCCCCGG TGTATGACCA GGTCACGCAA CCCGTCGAGG CTCCGTACCC TGCAGCCTGT 
GTCAAGATGG GCCAGCGTTG CGACTGCTAT ACCCAGCAAG CGACGCTGCT GCAGGTGGCT 
CACGACGTGT GCATGCAGAT CGTCCAGCGC GGCTATTTCA TGGATTGGAA ACGTCCTACG 
ACGGAGGCAG TCCGACAGCC GCGGCGCGAC GAACCAGTGC GCCAGGCTGC GCCAGTGCAG 
TCGCCCGTGG TCATCAACAT GCCTGCCCAG GCCCAGCAGG TCCAGCCAGT GTCTGAATGG 
TCACAAGGGC TCGCGGCGCG GAATGCTGAA GTGCGCTCCA TGGTGCGCTA G

Protein sequence

MRPLRSLRRQ RGFLYLTTGG NGTGKTLFTL YDVRKLQLET GRPVYFSGFE AKQPLLDFGW 
QPFEPECWQD LPDGSICLVD ECQKVMPVRG TGKPPEWIAA IAEVHRKRGF DFFLITQHPL 
NFDSFVRRLV AAPGWHRHFK ASSMGDSSNE LKWSSVKDNP QVANSSAMGE VTSRAFPREV 
YDWYASSSLH TARKRIPLKV WGAIAGVIAA FGMVGFAVWH FLGYTGAPAA AKPAAAPEAS 
ALSKMLTPAA ASGVGSSERQ PLTVAEYVEQ RKPRLPGFPN TAPVYDQVTQ PVEAPYPAAC 
VKMGQRCDCY TQQATLLQVA HDVCMQIVQR GYFMDWKRPT TEAVRQPRRD EPVRQAAPVQ 
SPVVINMPAQ AQQVQPVSEW SQGLAARNAE VRSMVR