Gene Dtpsy_3046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtpsy_3046
Symbol
ID	7383986
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidovorax ebreus TPSY
Kingdom	Bacteria
Replicon accession	NC_011992
Strand	+
Start bp	3251188
End bp	3252258
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	72%
IMG OID	643656356
Product	transcriptional regulator, AraC family
Protein accession	YP_002554479
Protein GI	222112215
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCGACC GCCCTGACCC CGCGCCGCCA CCGCCCGCAC CCACCGCACT CCTCGCTGCA 
CCCACGGCCG CCACGCCCAT GGCATTTGTG CAAGCCATCG TGCAGGCCTA CGCAGCGCGC 
GGAATGGACG CGGCGCAGGT GCTGGCGCTG GCACAAATCC CGCCAGAGCA GGTTGGCAAC 
TCTGCGGGCC GCATCACGGC GCAGCAGATG GAGGTGCTGT CCGCCGGTGC GATGCGCGAG 
CTGGACGACG AAGCCCTGGG CTGGTTCTCC CGCCGCCTGC CCTGGGGCAG CTACGGCCTG 
CTGGCGCGCG CCTCGCTGAG TGCACCCACA CTGGGCCTGG CGCTGGCGCG CTGGTGCCGC 
CACCACGCCC TGCTGACGGA CGACATCACG CTGCACCTGC ACGCCGAGGG CGAGCAGGCC 
ACGCTCACCA TCGCCGAGCA GCGCGACCTG GGCACGCTGC GCGAGTTCTG CCTGGTTTCC 
ACGCTGCGCA ACGCGCTCGG GCTGGCCAGC TGGTTCATCG ACTCGCGCCT GCCGGTGCTG 
GCGGCCGAGT TCCCCTTCGC GCCACCGCCC CATGCGCAGG CCTATGGCGT GCTCTTCAGC 
GGCCCGACGC GCTTTCAGGC ACCGCGCGCG GCGGTGCATT TCGATGCGCG CTACCTCGCG 
CTGCCGATCA CGCGCGACGA GGCGGCCATG CGCCAAATGC TGCAGCACGC GCTGCCCCTC 
ACCGTGCGCC AGTACCGCCG CGACCGGCTG CTGGTGCAGC GCGTGCGCCA GGTGCTGGCC 
GCCCTGCCCG ACGCGACCCA CAGCGCACAC ACGCTGGCCG AGCAGCTGCA CGTCTCGGCG 
CGCACGCTGC ACCGCCAACT CAAGGAGGAA GGCGCGTCGC TGCAGTCGCT GAAAGACGAG 
GTGCGCCGCA GCCGCGCGAT CGAGCTGCTG CACCGCAGCG ACCGCCCCAT CAAGCAGGTG 
GCGCAGGCCA CGGGCTTTGC CAGCGAGAAG AGCTTCATCC GCGCGTTTCG CGGCTGGACG 
GGCCAGTCGC CCGCGGAGTT CCGTCGCGGC GCACGCTCCG TCGCGGTATA G

Protein sequence

MPDRPDPAPP PPAPTALLAA PTAATPMAFV QAIVQAYAAR GMDAAQVLAL AQIPPEQVGN 
SAGRITAQQM EVLSAGAMRE LDDEALGWFS RRLPWGSYGL LARASLSAPT LGLALARWCR 
HHALLTDDIT LHLHAEGEQA TLTIAEQRDL GTLREFCLVS TLRNALGLAS WFIDSRLPVL 
AAEFPFAPPP HAQAYGVLFS GPTRFQAPRA AVHFDARYLA LPITRDEAAM RQMLQHALPL 
TVRQYRRDRL LVQRVRQVLA ALPDATHSAH TLAEQLHVSA RTLHRQLKEE GASLQSLKDE 
VRRSRAIELL HRSDRPIKQV AQATGFASEK SFIRAFRGWT GQSPAEFRRG ARSVAV