Gene BURPS1710b_A1374 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A1374
Symbol
ID	3694159
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	-
Start bp	1678772
End bp	1679803
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	70%
IMG OID	637731629
Product	short chain dehydrogenase
Protein accession	YP_336532
Protein GI	76819616
COG category	[R] General function prediction only
COG ID	[COG0300] Short-chain dehydrogenases of various substrate specificities
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.271507
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATGCA CGCTGAAGCC GATCGGCGAG CAGACGATCG TGATCACCGG CGCGACGAGC 
GGCATCGGGC TCGTCACCGC GCGCAAGGCC GCGAAGAAGG GCGCGAAGCT CGTGCTCGTC 
GCGCGCAACG ATACCGCGCT CGAGGCGCTG TGCGAGGAGA TCCGCCAGCA CGGCGGCCTC 
GCCGTCGCGG TCGCGGCCGA CGTGAGCCGC TACGAGGACG TCCAGCGCGC GGCGGCGAAG 
GCCGTCGAGA CGTTCGGCGG CTTCGACACG TGGATCAACA ACGCGGGCGT GACGATCTTC 
GGCTCCGCGC TGTCGGTGCC GCTCGACGAC CAGCGCCGGC TGTTCGATAC GAACTACTGG 
GGCGTCGTGC ATGGCTCGCT CGTCGCGTCC GAGCATTTTC GCCGCAAGAG CGACTTTCGC 
GGCGGCGCGA TCATCAACAT GGGCAGCGAG GCGTCCGACG CGCCGGTGCC GCTGCAAAGC 
GCGTATGCGG CATCCAAGCA CGCGATCAAG GGCTTCACCG ATTCGCTGCG CATCGAGCTC 
GAGGCGGACA ACGTGCCGGT GTCGGTCACG CTCGTCAAGC CCGCGGCCGT CGACACGATG 
TTCGTGATGC ACGCGAAGAA CTACATGAAC GTCGAGGCGA AGCTGCCGCC GCCGATCTAC 
GATCCGGACA TCGTCGCCGA CGCGATCCTG TTCGCGGCCG AGCATGCCCG TCGCACGCTG 
TTTGTCGGCG GCGCGGCGAA GCTCGCGTCG TCGGGCGCGT ATCACGCGCC GCGGCTGTTC 
GACCGGCTCG CCACGTCGCT GTTCTCGCGC GGGCAGCGCA CGATGCGCCC CGCGCGGCCG 
CGCGACGACA ACGCGCTGTA CGAGCCGACG CGCCCGTTGC ACGAGCGCGA AGGGATGGAC 
GGCGTGGTGC TGCGCTCGTG CGCGTACAAC ACGGTGATGC AGCGGCCGAG AGTCGCCGGC 
GCGCTCGCGC TGACGGCCGC GGCGCTCGTC GTCGCGGCGC TCGCGCGCGC TCGGCGCGAC 
GTCGCTTCGT AG

Protein sequence

MKCTLKPIGE QTIVITGATS GIGLVTARKA AKKGAKLVLV ARNDTALEAL CEEIRQHGGL 
AVAVAADVSR YEDVQRAAAK AVETFGGFDT WINNAGVTIF GSALSVPLDD QRRLFDTNYW 
GVVHGSLVAS EHFRRKSDFR GGAIINMGSE ASDAPVPLQS AYAASKHAIK GFTDSLRIEL 
EADNVPVSVT LVKPAAVDTM FVMHAKNYMN VEAKLPPPIY DPDIVADAIL FAAEHARRTL 
FVGGAAKLAS SGAYHAPRLF DRLATSLFSR GQRTMRPARP RDDNALYEPT RPLHEREGMD 
GVVLRSCAYN TVMQRPRVAG ALALTAAALV VAALARARRD VAS