Gene BURPS1710b_2526 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_2526
Symbol	atzB
ID	3688614
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	-
Start bp	2797463
End bp	2798893
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	71%
IMG OID	637728982
Product	hydroxydechloroatrazine ethylaminohydrolase
Protein accession	YP_333918
Protein GI	76811186
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0262801
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACGAC ACCCGAGCGC GCGAGCCGGC GCGCACTCCC TATCCCAGCC CCCCTCCCTT 
TCCCCGAACC GATCGAAGAC GCTCGTCGTC AAGCACGCCG ACGTGCTCGT GACGATGGAC 
GGCGCGCGCC GCGAACTGCG CGATGCGGGC CTGTATGTCG AGGACAACCG GATCGTCGCG 
GTCGGCCCGA GCGCCGAGTT GCCCGAGCAG GCGGACGAAG TGCTCGATCT GCGCGGGCAT 
CTCGTGATCC CGGGGCTCGT CAACACGCAT CATCATATGT ATCAGAGCCT CACGCGCGCG 
ATTCCCGCCG CGCAGAACGC CGAGCTGTTC GGCTGGCTCA CGAATCTATA CCGGATCTGG 
GCGCATCTGA CGCCGGAGAT GATCGAGGTA TCGGCGCTGA CCGCGATGGC CGAGCTGCTG 
CTGTCCGGCT GCACGACGTC GAGCGATCAT CTGTACATCT ATCCGAACGG CAGCCGGCTC 
GACGACAGCA TCGCGGCCGC GCGGCGCATC GGCATGCGCT TTCACGCGAG CCGCGGCAGC 
ATGAGCGTCG GGCAGCGCGA CGGCGGGTTG CCGCCCGATG CGGTCGTCGA GCGCGAGGCG 
GACATCCTGC GCGATACGCA GCGCGTGATC GAGACCTACC ATGACGAAGG CCGCTATGCG 
ATGCTGCGTA TCGCCGTCGC GCCGTGTTCG CCGTTCTCGG TGAGCCGCGG CCTGATGCGC 
GACGCGGCGG CGCTCGCGCG CGAGCACCGC GTGTCGCTGC ACACGCACCT CGCGGAGAAC 
GTGAACGACG TCGCGTACAG CCGCGAGAAG TTCGGGATGA CGCCGGCCGA GTATGCGGAG 
GATCTCGGCT GGGTGGGGCG CGACGTGTGG CACGCGCATT GCGTGCGGCT CGACGAGCCC 
GGCATCGCGC TTTTTGCGCG CACCGGCACG GGCGTCGCGC ATTGCCCTTG CTCGAACATG 
CGGCTGGCGT CCGGGATCGC CCCCATCGCG CGAATGCGGC GCGCGGGCGT GCCGGTCGGG 
CTCGGCGTCG ACGGTTGCGC GTCGAACGAC GGCGCGCAGA TGGTGGCCGA GGCGCGGCAG 
GCGCTGCTGC TGCAGCGCGT CGGATTCGGG CCGGACGCGC TGAGCGCGCG CGACGCGCTC 
GAGATCGCGA CGCTCGGCGG CGCGCGCGTG CTGAACCGCG ACGACATCGG CGCGCTCGCG 
CCGGGCATGG CCGCGGATTT CGTCGCGTTC GACCTGCGCA CGCCGCAGTT CGCGGGCGCG 
CTGCACGATC CCGTCGCGGC GCTCGTGTTC TGCGCACCGC CGCAGGCGGC GTACAGCGTC 
GTCAACGGGC GCGTCGTCGT GCGGGAAGGG CGGCTGACGA CGCTCGAGAT CGAGCCGCTC 
GTCGAGCGGC ACAACGCGCT GGCTCGCGCG CTTTGTGACG CGGCGCGCTG A

Protein sequence

MERHPSARAG AHSLSQPPSL SPNRSKTLVV KHADVLVTMD GARRELRDAG LYVEDNRIVA 
VGPSAELPEQ ADEVLDLRGH LVIPGLVNTH HHMYQSLTRA IPAAQNAELF GWLTNLYRIW 
AHLTPEMIEV SALTAMAELL LSGCTTSSDH LYIYPNGSRL DDSIAAARRI GMRFHASRGS 
MSVGQRDGGL PPDAVVEREA DILRDTQRVI ETYHDEGRYA MLRIAVAPCS PFSVSRGLMR 
DAAALAREHR VSLHTHLAEN VNDVAYSREK FGMTPAEYAE DLGWVGRDVW HAHCVRLDEP 
GIALFARTGT GVAHCPCSNM RLASGIAPIA RMRRAGVPVG LGVDGCASND GAQMVAEARQ 
ALLLQRVGFG PDALSARDAL EIATLGGARV LNRDDIGALA PGMAADFVAF DLRTPQFAGA 
LHDPVAALVF CAPPQAAYSV VNGRVVVREG RLTTLEIEPL VERHNALARA LCDAAR