Gene Dtpsy_3539 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtpsy_3539
Symbol
ID	7384665
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidovorax ebreus TPSY
Kingdom	Bacteria
Replicon accession	NC_011992
Strand	-
Start bp	3789216
End bp	3790385
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	62%
IMG OID	643656856
Product	protein of unknown function DUF1016
Protein accession	YP_002554962
Protein GI	222112698
COG category	[S] Function unknown
COG ID	[COG4804] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCAAGA AGACGCCTGC GGCGGCGGGA GCCGCACCCG CCGCTTTGCC TGCCGGCTAC 
GCCGGCATCC ACAGCGGCAT CGTGGAGCTG CTTGGCGCTG CGCGCCAGGC GGCGGCACGC 
AGCGTCAATG CGCTGATGAC GGCGAGCTAT TGGGAGATTG GCCGCCGCAT AGTGGAGGCC 
GAGCAACAGG GCAAACGACG TGCGGGTTAC GGTGAGCAGT TGATGGAGCG ACTGTCCACT 
GATTTGACCG CGCAGTTTGG GCGGGGCTTT GGCGTGAACA ACCTGGAGAA CATGCGGCGG 
TTCTTCCTCG CATACCCTGT CTCCGAGATT TCCCAGACAC TGTCTGGGAA ATTGGACAAC 
GAGCTGCCCG ACGAGAAATC CCAGACAGTG TCTGGGAAAT TGAGCCTCAC CGAGCTGGCA 
CAGGTGTTCA CGCTGCCGTG GTCGGCCTAT GTGCGGCTGC TGGTGGTCAA GGACAACCAT 
GCCCGGCGCT TCTACGAAGC CGAGGCACTG CGCGGCGGCT GGAGCGTGCG CCAGCTTGAC 
CGGCAGATTG GCAGCCAGTT TTACGAGCGC ACCGCCTTGT CCAAGGATAA GGCGGCGATG 
CTGGTCAAGG GAGCGGTGGC GAGGCCCGAG GATGCCGTCA CGCCCGACGA CGCGATCAAA 
GATCCGTATG TGCTGGAGTT CCTGAATCTC AAGGACGAGT ATTCGGAATC CGATCTGGAG 
GCCGCGTTGA TCCAGCGGCT GGAGGATTTT CTGCTGGAGC TGGGCGAAGG CTTCACCTTC 
GTCGGCCGGC AGCGGCGCTT GCGCATTGAC CAGACCTGGT ATCGGGTCGA TCTGCTGTTC 
TACCATCGCA AGTTGCGTTG CTTGGTCATC ATCGACTTGA AGCTGGGCAG CCTGACCCAT 
GCGGACGTGG GCCAGATGCA CATGTATTGC AACTACGCCA AGGAGCATTG GGCCTATCCC 
GATGAGAACC CGCCCGTGGG GTTGATTCTC TGTGCTGACA AGGGCCATGC GCTGGCGCGG 
TATGCCTTGG AAGGTTTGCC GACGAAGGTG ATGGCGGCGA ACTACCGTAC CGTGTTGCCA 
GATGCCGAGC TGTTGCAGAA AGAGCTGGAA ACCACGCGGC GCTTGCTGGA GTCGCGTGTG 
GTGAGGCAGC CCAAGAAGCT CCGGCAATAA

Protein sequence

MIKKTPAAAG AAPAALPAGY AGIHSGIVEL LGAARQAAAR SVNALMTASY WEIGRRIVEA 
EQQGKRRAGY GEQLMERLST DLTAQFGRGF GVNNLENMRR FFLAYPVSEI SQTLSGKLDN 
ELPDEKSQTV SGKLSLTELA QVFTLPWSAY VRLLVVKDNH ARRFYEAEAL RGGWSVRQLD 
RQIGSQFYER TALSKDKAAM LVKGAVARPE DAVTPDDAIK DPYVLEFLNL KDEYSESDLE 
AALIQRLEDF LLELGEGFTF VGRQRRLRID QTWYRVDLLF YHRKLRCLVI IDLKLGSLTH 
ADVGQMHMYC NYAKEHWAYP DENPPVGLIL CADKGHALAR YALEGLPTKV MAANYRTVLP 
DAELLQKELE TTRRLLESRV VRQPKKLRQ