Gene BURPS1106A_2040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2040
Symbol
ID	4900535
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	2022135
End bp	2023520
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	69%
IMG OID	640135270
Product	putative D-hydantoinase
Protein accession	YP_001066305
Protein GI	126453113
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.417545
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGATT TCGAGCAGGT GGTGCGCGGC CGGCTGGTTG ACGCGCAGCA GATTGTCGAG 
GACGGCTGGC TCGCAATTCG GGGCGGCCGG ATCGCGGCGC GCGGCGCGGG GGCGCCTCCG 
GCGGCGCGCG ACTTGATCGA CGCGCGCGGG CAGTGGGTGC TGCCGGGTGT CGTCGACGGC 
CAGGTGCACG CGGGCAGCCA GGCGAACCAC GAAGGGCTCG GGCGTGCGTC GCGCGCGGCG 
GCGGCGGGCG GAGTGACCGT GATGGTCGAC ATGCCGTACG ACGATCCGGA ACCTGTCGCG 
TCGCGGGCGC AGCTCGATCG CAAGATCGCG GAAGCCGAGC GCGATTGCCA CGTCGACATC 
GCGCTGTACG GCACGCTCAA CGCAAAGCAC GGCCTCGACG CGGCGGCCGG GCTGATCGAC 
GGCGGCGTCT GCGCGTTCAA GTTCTCGATG TTCGAGGCGA CGCCCGGCCG GTTCCCGCGT 
GTCGACGAGG ACGTGTTGTA CGACGCATTC CGGCTGGTCG CCCCGTCGGG CCTCGCGTGC 
GGCGTGCACA ACCAGATGCA GGACCTCACG CGCAAGAATA TCGCGCGGAT GATCGAGGCC 
GGCGACACGG GCTGGGATGC GTTCCTGCGC GCGCATCCAC CGCTGATCGA GAACCTGGCG 
ACCGCGCTGA TCTACGAGAT CGGCGCGGAG ACGGGCGCCC GCGCGCACGC GGTGCACGTG 
TCGACCTCGC GCGGCTTCGA GCTGTGCAAC ATGTTCCGGC GCGCCGGCCA TCACGCGAGC 
ATCGAAACCT GCGTGCAGTA CCTGATGCTC GATCACGAAA CGCATACGAA ACGCTTCGGC 
GCGAAGACGA AGCACTACCC GCCGATTCGC CCGCGCGCGG AGCAGGAATT GCTGTGGACG 
CATGTCGCGC GCGGCGAGTG CACGTTCGTG TCGTCGGATC ACGTGAGCTG GGAGCTCAAA 
CGCAAGGGGG ACGCCAACGT GTTCCGCAAC GCGTCGGGCG GTCCGGGGCT CGAAACGTTG 
CTGCCGGCGT TCTGGACCGG CTGCGAGCAG CATGGCATCG CGCCGACGCG GGTCGCCGAG 
CTGCTGGCGA CGAATCCGGC GCGGCACTTC CTGCTCGACG ATCGCAAGGG GTCGCTCGAC 
GTCGGCGCCG ACGCGGATTT CGTGATCCTC ACGCCCGAAC GCTACGCGTT CGATCCGTCG 
TGCAGCCTGT CGGCCGTGCA GTGGAGCGCG TTCGAGGGCA TGGAATTCGC GGTGCGCATC 
GCCGCCACAT ATTGTCGCGG CGCGCTCGTG TACGACGGCG CACGCATCGT CAATCCGGCG 
GGCTCGGGCC GCTTCCTGAA GCCGCATGGC AGCCGGCCGA TCGTCACGCA ACCGGAGCGC 
GCATGA

Protein sequence

MSDFEQVVRG RLVDAQQIVE DGWLAIRGGR IAARGAGAPP AARDLIDARG QWVLPGVVDG 
QVHAGSQANH EGLGRASRAA AAGGVTVMVD MPYDDPEPVA SRAQLDRKIA EAERDCHVDI 
ALYGTLNAKH GLDAAAGLID GGVCAFKFSM FEATPGRFPR VDEDVLYDAF RLVAPSGLAC 
GVHNQMQDLT RKNIARMIEA GDTGWDAFLR AHPPLIENLA TALIYEIGAE TGARAHAVHV 
STSRGFELCN MFRRAGHHAS IETCVQYLML DHETHTKRFG AKTKHYPPIR PRAEQELLWT 
HVARGECTFV SSDHVSWELK RKGDANVFRN ASGGPGLETL LPAFWTGCEQ HGIAPTRVAE 
LLATNPARHF LLDDRKGSLD VGADADFVIL TPERYAFDPS CSLSAVQWSA FEGMEFAVRI 
AATYCRGALV YDGARIVNPA GSGRFLKPHG SRPIVTQPER A