Gene Dtox_2133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_2133
Symbol
ID	8429115
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	2310288
End bp	2311535
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	45%
IMG OID	645034453
Product	Aluminium resistance family protein
Protein accession	YP_003191584
Protein GI	258515362
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4100] Cystathionine beta-lyase family protein involved in aluminum resistance
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.821926
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0213182
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTACATAG AGCTTGAGCA ATTGGAAGAG CTGGCGCTGG AAGCAGAAAA TGAGTTGTTG 
CCTGTGTACC GTGAATTGGA TAAAACTTCG TGGATTAATC ACAGCAAAGT TTTGGCTGCT 
TTTCAAGAAG AAAAGGTCAG CGATTTTCAT TTAAAGAGTT CCTCAGGTTA CGGTTATAAC 
GATATGGGCC GGGAGATTTT AGAGAAGTTA TATGCACGCA TCTTTGGTGC TGAAGCAGCT 
TTAGTACGCA GTCAAATCGT CTCAGGTACT CATGCAATGG CCATTTGCCT ATTTGGTATC 
CTGCGTCCTG GAGATGAGCT GGTTTCAGCA ACCGGGACTC CTTATGATAC ACTTGAAGAA 
ATTATAGGTA TCAGGGGCAG CGGGGGCGGT TCTTTAAAAG AATTTGGCAT CGCTTATCGC 
CAGGTTGAAT TATTGCCGGA TGGAAAACTG GATTATGAAA AATTGAAGGA AGCTGTTAGC 
TCACAAACTA AATGTATTAT GCTGCAAAGG TCCAGAGGTT ATTCGGAACG TCCTGCTTTA 
ACGGTAGCAC AAATAGGTGA ATTATGCAGT TTTGTTAAGC AGAACTGGCC CTCCATAATT 
GTTTTTGTGG ACAACTGCTA CGGAGAGTTT GTAGAGACAT TAGAACCTTG TGATGTAGGA 
GCTGATTTGG TTGCCGGTTC ATTGATTAAA AATCCTGGTG GGGGGTTGGC TCCTACAGGT 
GGTTATATTG TGGGTCGCAG TGAGCTTGTT GAATTGGCCG CCAACCGTTG GACAGCCCCG 
GGCATCGGAG CTGAGGTCGG TCCTTCACCT GATTTTCAGC GACTATTATA TCAAGGACTT 
TTTATTTCTC CCCATATTGT TAACGAATCA CTTAAAGGAG CAGTGTTTAC AGCCAAACTT 
TTTGAACGAC TACGGTTTAG AGTTTTTCCT GCCGCTGAGG ATTATAGGAC AGATATTATT 
CAAGCCGTGG AACTAGGTTC GCCGGAAAAG GTAATTGCTT TTTGTCGGGG AATTCAAAAA 
GCTTCACCGG TAGATGCTCA TGTTATTCCG GAACCGTGGG ACATGCCTGG TTATGGTGAT 
CAGGTAATTA TGGCTGCCGG CACTTTTGTT CAGGGTGCTT CTTTAGAACT GACAGCTGAC 
GCGCCGATTC GCCGGCCTTT CATAGTTTAC CTGCAAGGAG GTTTATCCAG GCAATATGTA 
AAGTTGGGTG TGCTGTCCGC GGCCAAGTTT GTGCTTGGGT TAGGTTAA

Protein sequence

MYIELEQLEE LALEAENELL PVYRELDKTS WINHSKVLAA FQEEKVSDFH LKSSSGYGYN 
DMGREILEKL YARIFGAEAA LVRSQIVSGT HAMAICLFGI LRPGDELVSA TGTPYDTLEE 
IIGIRGSGGG SLKEFGIAYR QVELLPDGKL DYEKLKEAVS SQTKCIMLQR SRGYSERPAL 
TVAQIGELCS FVKQNWPSII VFVDNCYGEF VETLEPCDVG ADLVAGSLIK NPGGGLAPTG 
GYIVGRSELV ELAANRWTAP GIGAEVGPSP DFQRLLYQGL FISPHIVNES LKGAVFTAKL 
FERLRFRVFP AAEDYRTDII QAVELGSPEK VIAFCRGIQK ASPVDAHVIP EPWDMPGYGD 
QVIMAAGTFV QGASLELTAD APIRRPFIVY LQGGLSRQYV KLGVLSAAKF VLGLG