Gene BURPS668_A3028 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A3028
Symbol
ID	4885707
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	2876547
End bp	2878058
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	74%
IMG OID	640132964
Product	MmgE/PrpD family protein
Protein accession	YP_001064019
Protein GI	126443089
COG category	[R] General function prediction only
COG ID	[COG2079] Uncharacterized protein involved in propionate catabolism
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGAAG CCGATCTGAC CATCGTACGG GCCGCCGCGC GCCGCGCCGC GCCCGTCGCC 
ACGCCGCCCG CGGACGGCAT CGTCGGCGCG CTCGGACGCT TCGCGGCCGC GGTGCGCACC 
GACGGGCTCG AACGGCAACT GCGCGTGGAG GCCGCCGCGC GCGTGCTCGA CCTGCTCGGC 
AATAGCCTGA TCGCGCATCG CGAGTCCGTC GCACATGCAG TGCTGCGCGT CGCGCGCGGC 
TGGGCGGCGC GAGGCCCGGC GGGCGTCGTC GGCGCGCGCG ACCGGTTGCC CGCCGCGCTC 
GCCGCGCTCG TGAACGGTAC GCTCGCGCAC GCGATGGACT TCGACGATTC GCACATGCTG 
TCGGTGCTGC ATCCGAGCGC GTCGGTGATT CCCGCGGCGC TCGCCGTGGC CGAGGCGACG 
AATGCGTCGG GCGCCGCGCT GCTCGATGCG ATCACGGTCG GCACCGAGAT CTGCATCCGG 
CTCGGCGTCG CCGCATACAG CGAGCGGCTC GGCAACTCGG TGTTCTTCGA TCGCGGCCAG 
CACGCGACGT CGATCTGCGG CACGCTCGGC GCGGCGGCGG CGGCCGCGAT GCTGTACGGG 
CTCGACGCGG CGGGGATCGC GTCGGCGCTC GGCATCGCGG CGAGCATGGG CGCGGGCCTG 
CTCGAGGCGA ACCGCACGGG CGGCTCGGTC AAGCGCGTGC ACTGCGGCTG GGCCGCGCAC 
GCGGGCGTGA GCGCGGCGGA ATTCGCGGCG GCGGGCGTCA CCGCGCCGCC GACCGCGCTC 
GAAGGCCGGT TCGGCTTCTT CCATGCGTGG TGCGGCGATC TCGCCGATCC GAACGCGGTG 
CTGAGCCATC TCGGCGACGA ATGGGAGACG AGCCAGATCA TCTTCAAGCC GTATCCGTGC 
AACCATTTCA CGCACCCGGG CATCGACGCC GCGCTGCAAC TGAAGGCGCA GGGCCTGCAT 
GCGGATGAGG TGGCGTCGAT CGAGCTGAGC GTCGCGAGCC CGACGCTGCG CACGATCGGT 
GAGCCCGCCG AAATCAAGAT GCGTCCGCCG AACGGCTATG CGGCCGCCTT TTCGGGGCCG 
TACACGGTCG CGGCCGCGCT GCTCGGCGGC GGCGGGCTCG GCGTGTGGTT CGACGATTTC 
GACGATGCGC ATGTGCACGA TCCCGCGCGG CGCGCGCTCG CCGCGAAGGT GCGCTGCGTC 
GCCGAGCCGT GGTGCGACGC GCGCTTTCCG GCGGGGCTGC CGGCGGTGAT GCGCGTGACG 
ACCGTCGGCG GGCACGCGCT CGAGGCGCGC ATCGAATCGA GCAAGGGCAC CAACGCGCGG 
CCGCTGACCG AGCAGGAGCT GGCGGCGAAG TTCATGCTGG CCGCGGGCGC GACGCTCGGC 
ATGCCGGCGG CGCTCGCGCT GCGCGATGCG GTGTCGGCGC TCGTCGCGGA CGGGCCGCTC 
GCGCCGCTCA TGGAACTGAC GTCCGGCACG GCCGGCGCGT CGCCGAACGG CACGGGAGGC 
TCGCTTGACT GA

Protein sequence

MSEADLTIVR AAARRAAPVA TPPADGIVGA LGRFAAAVRT DGLERQLRVE AAARVLDLLG 
NSLIAHRESV AHAVLRVARG WAARGPAGVV GARDRLPAAL AALVNGTLAH AMDFDDSHML 
SVLHPSASVI PAALAVAEAT NASGAALLDA ITVGTEICIR LGVAAYSERL GNSVFFDRGQ 
HATSICGTLG AAAAAAMLYG LDAAGIASAL GIAASMGAGL LEANRTGGSV KRVHCGWAAH 
AGVSAAEFAA AGVTAPPTAL EGRFGFFHAW CGDLADPNAV LSHLGDEWET SQIIFKPYPC 
NHFTHPGIDA ALQLKAQGLH ADEVASIELS VASPTLRTIG EPAEIKMRPP NGYAAAFSGP 
YTVAAALLGG GGLGVWFDDF DDAHVHDPAR RALAAKVRCV AEPWCDARFP AGLPAVMRVT 
TVGGHALEAR IESSKGTNAR PLTEQELAAK FMLAAGATLG MPAALALRDA VSALVADGPL 
APLMELTSGT AGASPNGTGG SLD