Gene BURPS668_2862 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_2862
Symbol
ID	4884976
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	2818496
End bp	2819647
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	68%
IMG OID	640128790
Product	radical SAM domain-containing protein
Protein accession	YP_001059881
Protein GI	126439549
COG category	[L] Replication, recombination and repair
COG ID	[COG1533] DNA repair photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.22952
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGAAC GATACGACGT CGAATACCCG GTGATGCCGC CCGCGCCCCG TAAGGGGCGC 
GGCGCGTTGG GCAACCTGCA GGGGCGCTAC GAGAGCGTCG AGCGCGAGGC GGTCAACGAC 
GGCTGGACGC GCGACGGCGA GCCGCGCGCG CCGCTGCGCA CGCAGGTGTT CGAGGAGCGC 
GCCAGGACGA TCCTCACGCG CAATGCGTCA CCCGACATTC CGTTCAATGT ATCGCTGAAT 
CCGTATCGCG GCTGCGAGCA CGGCTGCATC TACTGCTTCG CGCGGCCGAC GCACAGCTAT 
CTCGGGCTGT CGCCGGGGCT CGATTTCGAA AGCCGGATCT ACGCGAAGGT GAATGCCGCG 
GAGTTGCTCG CGCGCGAACT CGCGAAGCCG CGCTACGTGC CCGAGCCGAT CGCGCTCGGC 
GTGAATACGG ACGCGTATCA GCCGGTCGAG CGCGAACGGC GGATCACGCG GCAGGTGATC 
CAGGTGATGC ATGACCACGG TCAGCCGTTT GCCGCGATCA CGAAGTCGTC GCTGATCGAG 
CGTGATCTCG ATCTGCTCGC GCCGATGGCC GAGCGCCGGC AGGTGATGGC GGCCGTCACG 
ATCACGACGC TCGATCCCGA GCTCGCGCGC GCGCTCGAGC CGCGCGCCGC GACGCCCTCG 
CGCCGGCTGC GGACGATCCG CGCGCTGCGC GACGCGGGGG TGCCGGTCGG CGTGAGCATC 
GCGCCGATGA TCCCGTTCGT CACCGAACCG GATCTCGAGC GCGTGCTCGA GGCGTGCGCG 
GACGCGGGGG CGACGCACGC GAGCTATATC GTGTTGCGAT TGCCGTGGGA AGTCGCGCCG 
CTTTTCACCG AATGGCTCGC CGCGCATTTT CCGGATCGCG CGGAGCGCGT GATGGCGCGT 
GTGAGGGACA TGCGCGGCGG CAAGGATTAC GACGCGGATT TCAGCCGCCG GATGAAAGGC 
GAAGGAATGT GGGCCGAGTT GCTCAAGCAG CGCTTCCGGA TGGCGGTCAA GCGCTGCGGG 
CTGAACGAAC GCGCGCGGGG AATTCTCGAT TTTTCGCAGT TTTGCGCGCC GCGACGGTCG 
AAACCGCCGC CGCCCGTGCG ACCGCGTGCG GCGGCGCAAA CCGGAGACCA GCCGCAGCTC 
AGTCTGTTCT GA

Protein sequence

MSERYDVEYP VMPPAPRKGR GALGNLQGRY ESVEREAVND GWTRDGEPRA PLRTQVFEER 
ARTILTRNAS PDIPFNVSLN PYRGCEHGCI YCFARPTHSY LGLSPGLDFE SRIYAKVNAA 
ELLARELAKP RYVPEPIALG VNTDAYQPVE RERRITRQVI QVMHDHGQPF AAITKSSLIE 
RDLDLLAPMA ERRQVMAAVT ITTLDPELAR ALEPRAATPS RRLRTIRALR DAGVPVGVSI 
APMIPFVTEP DLERVLEACA DAGATHASYI VLRLPWEVAP LFTEWLAAHF PDRAERVMAR 
VRDMRGGKDY DADFSRRMKG EGMWAELLKQ RFRMAVKRCG LNERARGILD FSQFCAPRRS 
KPPPPVRPRA AAQTGDQPQL SLF