Gene BBta_5003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_5003
Symbol
ID	5150239
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	-
Start bp	5233458
End bp	5234336
Gene Length	879 bp
Protein Length	292 aa
Translation table	11
GC content	66%
IMG OID	640559784
Product	putative short-chain dehydrogenase/reductase (SDR)
Protein accession	YP_001240913
Protein GI	148256328
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.874894
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.0924335
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGACTGC TCGACGGCAA GGTGGCGCTG ATCACCGGCG CTGGTGGTGG CCTCGGCGAG 
GCCTATGCAA GGCTGTTCGC GCGCGAGGGC GCGGCGGTGG TGGTCAACGA TCTCGGCGGC 
CCGCGTGATG GGTCCGGCTC GGATCTGTCG ATGGCCGGGC AGGTGGCGGC CGCGATCACG 
GCCGAGGGCG GCCGCGCCGT CGCCAATGGC GCTGACATCT CGACCATGGC GGGCGGGCAG 
TCGGTGTTCG ACGATGCGAT CCGGCATTTC GGCCGCGCCG ACATTCTGGT CAACAATGCC 
GGCATCCTGC GCGACCAGAC CTTTGCCAAG TCCAGCGAGG CCGATTGGGA CAAGGTGATC 
CAGGTCCACC TCAAAGGCAC TTTCTGCTGT ACCTTGCCGG TGTTCCGCTG GATGCGCGAC 
AATGGCGGCG GCGTCATTGT CAACACGTCC TCGACCTCCG GGCTGATCGG CAATTTCGGC 
CAGTCCAATT ACGGCGCGGC GAAGGGCGGT ATTTGGGGCC TGTCCAACGT GCTGGCGGTG 
GAGGGCCGCA AGTACAACAT CCGGGTGTGG ACCCTGGCGC CGGGCGCGCT GACACGGATG 
ACCGCCGACC TGCCGCGCTA CAAGGAAAAT CCGGGCGCCG CACTGACGCC CGAAGGCATC 
GCGCCGGCGG TGCTGTATAT GGTCAGCCAC CTCTCCGGCG ATCAGACCGG CAAGGTGCTC 
GGCGTCTCCG GCCCGCGCGG CGTGCGCGAG TTGCGCATGA TGGAAATGGA CGGCTGGAAG 
CCGCCATCCT CGGCCTGGCG GCCCGAGGAC ATCGCTGTTC ATGCAGAGGA GATATTCTTT 
TCGGAGGCCG ACATTCAAAA GTCCGCCCGG CGGTTTTGA

Protein sequence

MGLLDGKVAL ITGAGGGLGE AYARLFAREG AAVVVNDLGG PRDGSGSDLS MAGQVAAAIT 
AEGGRAVANG ADISTMAGGQ SVFDDAIRHF GRADILVNNA GILRDQTFAK SSEADWDKVI 
QVHLKGTFCC TLPVFRWMRD NGGGVIVNTS STSGLIGNFG QSNYGAAKGG IWGLSNVLAV 
EGRKYNIRVW TLAPGALTRM TADLPRYKEN PGAALTPEGI APAVLYMVSH LSGDQTGKVL 
GVSGPRGVRE LRMMEMDGWK PPSSAWRPED IAVHAEEIFF SEADIQKSAR RF