Gene BTH_I2073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BTH_I2073
Symbol
ID	3848116
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia thailandensis E264
Kingdom	Bacteria
Replicon accession	NC_007651
Strand	+
Start bp	2347153
End bp	2348565
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	70%
IMG OID	637841742
Product	hydroxydechloroatrazine ethylaminohydrolase
Protein accession	YP_442597
Protein GI	83719602
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.722851
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGCGAT ACTCGAGCGC GCGCGCCGGC GCGCAATCCC AATCCCCGAA CCGGCCGAGG 
ACGCTCGTCG TCAAGCATGC CGACGTGCTC GTGACGATGG ACGGCGCGCG CCGCGAGCTG 
CGCGACGCGG GCCTGTACGT CGAGGACAAC CGGATCGTCG CGGTCGGGCC GAGCGCCGAG 
CTGCCCGCGC AGGCGGACGA AGTGCTCGAT TTGCGCGGCC ATCTCGTGAT CCCGGGGCTC 
GTCAACACGC ATCATCATAT GTATCAGAGC CTCACGCGCG CGATCCCCGC CGCGCAGAAC 
GCCGAGCTGT TCGGCTGGCT CACGAATCTA TACCGGATCT GGGCGCACCT GACGCCGGAG 
ATGATCGAGG TGTCGGCGCT GACCGCGATG GCGGAGCTGC TGCTGTCCGG CTGCACGACG 
TCGAGCGATC ATCTGTACAT CTATCCGAAC GGCAGCCGGC TCGACGACAG CGTTGCGGCC 
GCGCAGCGCA TCGGCATGCG CTTTCACGCG AGCCGCGGCA GCATGAGCGT CGGGCAGCGC 
GACGGCGGGC TGCCGCCCGA CTCGGTCGTC GAGCGTGAGC CGGATATCCT GCGCGACACG 
CAGCGCGTGA TCGAGACCTA CCATGACGAA GGCCGCTATG CGATGCTGCG CGTCGTCGTC 
GCGCCGTGTT CGCCGTTCTC GGTGAGCCGC GGCTTGATGC GCGACGCGGC GGCGCTCGCG 
CGTGAGCATC GCGTGTCGCT GCACACGCAT CTCGCGGAGA ACGCGAACGA CGTCGCATAC 
AGCCGCGAGA CATTCGGGAT GACGCCCGCC GAATATGCGG AGGATCTCGG CTGGGTCGGG 
CGCGACGTGT GGCATGCGCA CTGCGTGCAA CTGGACGAAT CCGGCATCGC GCTTTTCGCG 
CGGACCGGCA CGGGCGTCGC GCATTGCCCA TGCTCGAACA TGCGGCTTGC GTCCGGGATC 
GCGCCCGTCG CGCGGATGCG CGTTGCGGGC GTGCCGGTCG GGCTGGGCGT CGACGGCAGC 
GCGTCGAACG ACGGCGCGCA GATGGTCGCC GAGGTACGGC AGGCGCTGTT GCTGCAGCGC 
GTCGGATTCG GCCCGGACGC GATGACCGCG CGCGATGCGC TCGAGATCGC GACGCTCGGC 
GGCGCACGCG TGCTGAACCG CGACGACATC GGCGCGCTCG CGCCCGGCAT GGCGGCGGAT 
TTCGTCGCGT TCGATCTGCG CACGCCGCAG TTCGCGGGCG CGCTGCACGA TCCCGTCGCG 
GCGCTCGTGT TCTGCGCGCC GTCGCAGGCG GCGTACAGCG TCGTCAACGG ACGCGTCGTC 
GTGCGGGAAG GGCGGCTGAC GGCGTTCGAG ATCGAGCCGC TCGTCGAGCG GCACAACGCG 
CTCGCGAAGG CGCTTTGCGA GGCGGCGCGC TGA

Protein sequence

MERYSSARAG AQSQSPNRPR TLVVKHADVL VTMDGARREL RDAGLYVEDN RIVAVGPSAE 
LPAQADEVLD LRGHLVIPGL VNTHHHMYQS LTRAIPAAQN AELFGWLTNL YRIWAHLTPE 
MIEVSALTAM AELLLSGCTT SSDHLYIYPN GSRLDDSVAA AQRIGMRFHA SRGSMSVGQR 
DGGLPPDSVV EREPDILRDT QRVIETYHDE GRYAMLRVVV APCSPFSVSR GLMRDAAALA 
REHRVSLHTH LAENANDVAY SRETFGMTPA EYAEDLGWVG RDVWHAHCVQ LDESGIALFA 
RTGTGVAHCP CSNMRLASGI APVARMRVAG VPVGLGVDGS ASNDGAQMVA EVRQALLLQR 
VGFGPDAMTA RDALEIATLG GARVLNRDDI GALAPGMAAD FVAFDLRTPQ FAGALHDPVA 
ALVFCAPSQA AYSVVNGRVV VREGRLTAFE IEPLVERHNA LAKALCEAAR