Gene Dtpsy_1362 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtpsy_1362
Symbol
ID	7382614
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidovorax ebreus TPSY
Kingdom	Bacteria
Replicon accession	NC_011992
Strand	-
Start bp	1423663
End bp	1424703
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	75%
IMG OID	643654680
Product	Sel1 domain protein repeat-containing protein
Protein accession	YP_002552826
Protein GI	222110562
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00293733
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCACGA ACCCTGGCGA CGGCCTGTCC CTCGCCCCGC TCGACCCCGC GCCCACGCAA 
ACCGCGCCTG CTGCGGCCTC ATCGCACGTC GCACGCACCT GCCCACGCTG CCACTACACG 
CGCCAGGCCA GCGACACCGC CCCCGCCTGG CAATGCCCGC GCTGCGCGGT GGTCTACGAC 
AAGGCCACGC CGCGCCCCCG CGCACGCGCG GGCCACGATG AAGAGGACGA TACCCAGCCC 
GTCCCGCTGG ACCCGCGCCG CGCCCGGGCC AGCGCGGGCC TGCCCTGGGC CTGGATCGCC 
CTGGGCAGCG CCGTGCTGGC CGGGGCCGCG CTGCTGGGCT GGAAGTGGAA CGGCGAGCGC 
CAGCGCAGCG CCCAACAGGT GCAACGCGCC GCCAGCGACA GCCGCGCCGC CGATGTCAGC 
CAGGCCCGCG CCGTGCAGGA CGGGCGGGCG CGCATCGATG CACTGGAACA CCAGTGGCGC 
ATGGGCGAAG GCGCCCAGGC GCTGCCTGCC GTGCGCGCGC TGGCCGACGA GGGCGAGCCG 
CGGGCCATGG TGCTGCTGGG CTCCATGCTG CTGGGTGGCA GCAGCTACCG CAACGCGATC 
GGCCAGCCGC TGGACCCGGC CGAGGCGCAG CAATGGCTGG AGCGCGCCGC CCGCGCGGGC 
GATGCCACTG CCGCCGTGCG CCTGGGGGGC CTGTATGAGC GCGGTGAACA TGTGCCGCGC 
CAGCCCTCAC TGGCCGAGAA CTGGTACCTG CGTGCCGCGC GCCAGGGCGA CGGCGCGGGC 
CTGTACAGCC TGGGCATGCT CTACGCGCGG GGCGCCGATC CCGTAAGCCA ACGCCCCGTC 
CCCGCGTGGA TGCTGCTCAC GCTGGCCGAA CGCGCCTCGC GCGCCGCGCC GGAGCGCGAC 
GCGCTGCTGA CCGAGCAGCA CTACCCGTCC AGCGCCCGTG CAGGCCCGGT CCGCCTCAAG 
GACAAGCTGC ATCCCAGCGA CATTGCCGAG GCCGAGCGCC TGGCCGACGC CTGGAAGCCC 
GGCCAGCCGC TGGGCTTCTA G

Protein sequence

MTTNPGDGLS LAPLDPAPTQ TAPAAASSHV ARTCPRCHYT RQASDTAPAW QCPRCAVVYD 
KATPRPRARA GHDEEDDTQP VPLDPRRARA SAGLPWAWIA LGSAVLAGAA LLGWKWNGER 
QRSAQQVQRA ASDSRAADVS QARAVQDGRA RIDALEHQWR MGEGAQALPA VRALADEGEP 
RAMVLLGSML LGGSSYRNAI GQPLDPAEAQ QWLERAARAG DATAAVRLGG LYERGEHVPR 
QPSLAENWYL RAARQGDGAG LYSLGMLYAR GADPVSQRPV PAWMLLTLAE RASRAAPERD 
ALLTEQHYPS SARAGPVRLK DKLHPSDIAE AERLADAWKP GQPLGF