Gene BURPS668_A1021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1021
Symbol
ID	4888681
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	986899
End bp	988086
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	72%
IMG OID	640130961
Product	NAD-dependent epimerase/dehydratase family protein
Protein accession	YP_001062020
Protein GI	126443945
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3320] Putative dehydrogenase domain of multifunctional non-ribosomal peptide synthetases and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.107249
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTGATCT GGAAAACCGC GCTTTCGCTC ACCTGGAAGG CGGGCCTCGT GTCGCCCGCG 
AGCGCGCCCG CCGCGGCCGC GCACGTCGAC CGGGTCGTGC TCACCGGGGC AACAGGCTTC 
ATCGGCGGCG CGGTGCTCGT GTCGCTCGTG AACGCCGGGC TGCTCGATCG CGTCGTCTGC 
ATCGTGCGCG CGTGCGATCG CGCGCATGCG CTCGCGCGGC TGCGCGCAGC CGCGCTCAGG 
AGCGGGCTCG CGCCGTACTG GGCCGAGCGG CTGAGCGAGG CGAACGTGAT CGCGGGCGAG 
CTTGGCGGCG CGCTCGCCGA CGCGGACGCG GCGCACATCG CGCTCGCGTC GCACGTGATT 
CACTGCGCGG GCGTGGCTTC GCTCGCCGAC GCGCGCATCG TCAACGAGAC GAACGTCGGC 
GCGACGCTGC GCTTTGCGCG CCGCTTCGCG GGCAGCCGGC GGCTGCAGCG TTTCGTGCAC 
GTCGGCGCGG CGTTCGCATG CGGGCTGCGG GCACGCGGCA CGATTCGTGA GGACGATACG 
CCGGCGCGCG GGCGCGAGAT CGATTTCGCG CCGTACACGC GCGGCAAGCG CGATGCGGAA 
GCGCAATTGC GCGCGCTCGG CCTGCCGCTC GTCGTCGTGC GGCCGTCGTG CGTCGTCGGG 
CACACGCTGC TCGGCACGCA GCCGTCGGCG AGCACGTTCT GGATGTTTCG CATCGTTCAT 
GCGGCGCGCC GCTTCACCGC GCGGCCGATG GCGCGCATCG ACGTGATCGC GGTGGACGAT 
TGCGCGCGCG CGCTGATGCT GCTCGCGCTG AAGCCGTCGC TCGCGCATGA TACGTACCAC 
GTATCGGCGG GCGACGAAGC GCCCACCGTC ACGCAGATCG TGCGCGCGAT GGACGAGGCG 
GTGGGCCTCG ACGACGAGCC CCGCTACGCG CTCTGCTCGC CGGCCGAGTT TCCTTCGATC 
GCGCGCGACG TGCTCGGCCG CCGCGACGCC CCGCGCGAGC GCGTGATCCG GCGCGCGTTG 
CAGTCTTACG CCGCGTTCGC CGAGCTCGAT CACGTGTTCG ACAACGCGCG CGTGCGCCGC 
GAGATCGACT TCGAGCCGCT GCCGTTCGTC GATTACGTGA ACGAGTGCAT GCGCACGTCG 
CGCGGCATCG ACGTGCTCGC GCAGATGCCG CGGACGGCAG CCCGCTAG

Protein sequence

MLIWKTALSL TWKAGLVSPA SAPAAAAHVD RVVLTGATGF IGGAVLVSLV NAGLLDRVVC 
IVRACDRAHA LARLRAAALR SGLAPYWAER LSEANVIAGE LGGALADADA AHIALASHVI 
HCAGVASLAD ARIVNETNVG ATLRFARRFA GSRRLQRFVH VGAAFACGLR ARGTIREDDT 
PARGREIDFA PYTRGKRDAE AQLRALGLPL VVVRPSCVVG HTLLGTQPSA STFWMFRIVH 
AARRFTARPM ARIDVIAVDD CARALMLLAL KPSLAHDTYH VSAGDEAPTV TQIVRAMDEA 
VGLDDEPRYA LCSPAEFPSI ARDVLGRRDA PRERVIRRAL QSYAAFAELD HVFDNARVRR 
EIDFEPLPFV DYVNECMRTS RGIDVLAQMP RTAAR