Gene BBta_2050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_2050
Symbol
ID	5153053
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	+
Start bp	2121006
End bp	2122352
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	68%
IMG OID	640556988
Product	hydroxydechloroatrazine ethylaminohydrolase
Protein accession	YP_001238144
Protein GI	148253559
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.888241
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCA TGCCGATCTG GATCAAGGAC CCACTCGCCA TTCTGGCCGA GGGTGCCGGC 
CGCGGCCTCG TCGTCAAGGA CGGCCGCATC GTCGAGCTGG TGCCGGCCGG CGCCGAGCCC 
GCGACCGCGG GCGCGGTTGC ATACGATGCC AGTGGACATG TCGTGATCCC CGGGCTGATC 
AACACGCACC ACCATTTCTA CCAGACGCTG ACGCGTGCGC TGCCGGCGGC GATGGACCGC 
GAGCTGTTCC CGTGGCTGAA GGCGCTGTAT CCGATCTGGG CGAAGCTGAC GCCGGAGGCG 
CTCGACGCGG CGGTCACGGT CGCGATGGCC GAGCTGATGC TGTCGGGCTG CACCACGACG 
ACGGATCATC ATTACGTGTT CCCTGCCGGT CTCGATGACG CTGTCGGGAT CGAAGTCGAG 
GCCGCGAAGC GGCTCGGCAT CCGGGTGCTG TTGACCCGAG GCTCGATGAA TCTGTCCGAG 
CGCGACGGCG GATTGCCTCC GGACAGTGTG GTGCAGGACG AGGATACGAT CCTCGCCGAT 
AGCGAGCGCG TGGTCGCGCA GTTTCACCAG CGCGGGCCGG ATGCGATGGT GCAGATCGCG 
CTGGCGCCGT GCTCGCCCTT CTCCGTCACG GGATCCTTGA TGCAGCAGAC GGCTGCCTTG 
GCGGAGAAGC TCGACGTGCG CCTGCACACG CATCTGGCGG AGACCGAGGA CGAGAACCGA 
TTCTGCGAAG CCATGTTCGG TTGTCGTCCG CTCGATTATC TCGAGAAACA TGGCTGGCTC 
GGCCCGCGGA CCTGGCTCGC GCACGGCATC TTCTTCAACG CCGACGAAAT GAAGCGCCTC 
GGCAAGGCCA AGACGACGAT CAGCCATTGC GCCTGCTCGA ACCAGCTGCT TGCCTCCGGA 
GCTTGCCCGG TGTGCGAGAT GGAAGATGCC GGTGTCGGCA TCGGTATCGG CGTCGACGGC 
TCTGCCTCCA ATGACGGCTC CAATCTGATG CAGGAGCTGC GGGCCGCGTT CCTGATGCAG 
CGCGCCCGCT ACGGCGTCAG CCGGCTCAGC CACAAGGACG CGCTGCGCTG GGCGACGAAG 
GGCTCGGCAG CCTGCGTCGG CCGTCCCGAG CTCGGCGAGA TCGCGGTCGG CAACGCCGCC 
GATCTCGCGC TGTTCAAGCT CGACGAGCTG CGCTTCTCCG GCGCCAGCGA TCCGATCGCG 
GCGCTGGTGC TGTGCGGCGC GCACCGCGCC GACCGCGTCA TGGTCGGCGG CCGCTGGACG 
GTGATCGACG GCGCCATTCC GGGCCTCGAC GTCGCCGCGC TGATCCGGCG CCACAGCGCG 
GCGGCAGAAC GGATGCGGGC CGGCTGA

Protein sequence

MSTMPIWIKD PLAILAEGAG RGLVVKDGRI VELVPAGAEP ATAGAVAYDA SGHVVIPGLI 
NTHHHFYQTL TRALPAAMDR ELFPWLKALY PIWAKLTPEA LDAAVTVAMA ELMLSGCTTT 
TDHHYVFPAG LDDAVGIEVE AAKRLGIRVL LTRGSMNLSE RDGGLPPDSV VQDEDTILAD 
SERVVAQFHQ RGPDAMVQIA LAPCSPFSVT GSLMQQTAAL AEKLDVRLHT HLAETEDENR 
FCEAMFGCRP LDYLEKHGWL GPRTWLAHGI FFNADEMKRL GKAKTTISHC ACSNQLLASG 
ACPVCEMEDA GVGIGIGVDG SASNDGSNLM QELRAAFLMQ RARYGVSRLS HKDALRWATK 
GSAACVGRPE LGEIAVGNAA DLALFKLDEL RFSGASDPIA ALVLCGAHRA DRVMVGGRWT 
VIDGAIPGLD VAALIRRHSA AAERMRAG