Gene TM1040_2820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2820
Symbol
ID	4076639
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2984942
End bp	2985931
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	57%
IMG OID	638008148
Product	3-beta hydroxysteroid dehydrogenase/isomerase
Protein accession	YP_614814
Protein GI	99082660
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0702] Predicted nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0203208
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.613644
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAAAC TGGTCACCAT TTATGGCGGT TCAGGGTTTG TCGGTCGCTA TATCGCGCGC 
CGCATGGCAA AAGAAGGCTG GCGCGTGCGC GTGGCCGTTC GTCGCCCGAA TGAGGCAATG 
CACGTCAAAC CCTATGGTGT GCCGGGGCAG GTTGAGCCGG TTTTCTGCAA CATCCGCGAT 
GACGCTTCTG TCGCTGCTGT TATGGCAGGC GCAGATGCGG TGGTAAATTG CGTGGGTGTT 
CTGAACGAAG TCGGCAAAAA CACGTTCTCT GCGGTGCAGT CCGAAGGGGC TGGTCGCATC 
GCGCGGATCG CGGCTGATAC AGGTGTTGAA CGTCTTGTTC ATGTTTCTGC GATTGGTGCA 
GATGCTGATG GCGACAGCGC GTATGCCCGC ACCAAGGCCG AAGGGGAAGC TGCGGTGCTT 
GAAGCTTTTC CCTCTGCAAT GATCCTGCGT CCCTCGATCA TCTTTGGCCC CGAAGACCAG 
TTCTTTAATC GCTTTGCGAG CATGACGCGC TTTGGCCCCG TTCTGCCCAT CGCAGGAGGG 
ACGACACGGT TTCAGCCGGT CTATGTCGAT GACGTCGCGA AAGCTGCTGT TGCGGGTCTG 
ACTGGGCAGG CTGCTGCAGG AACCTATGAG CTTGGTGGCC CCGAGGTCAA AAGCTTTACA 
GAGTTGATGT CGCAAATGCT TGATGTGATC CATCGCCGCC GTCTCGTTGT GTCGCTACCG 
AATTTTGTCG CCCGCCTCAT GGCTTTTGGG TTCGATATGG CGCAGGCGGT GACCTTTGGC 
CTGTTTACAA ACGGCCTGCT GACGCGCGAC CAACTAAAGA ACCTGCAAAA CGACAATGTG 
GTCAGTGAAG GCGCCAAAGG TCTGGCAGAC CTCGGGATCG AACCGGTTAC CATGGGGTCC 
GTTCTACCCG ACTATCTGTG GAAGTTCCGC CCATCCGGTC AGTACGACGA ATTGATGAAA 
TCGGCCGGTA ACCTGCGCGG AGACATCTGA

Protein sequence

MSKLVTIYGG SGFVGRYIAR RMAKEGWRVR VAVRRPNEAM HVKPYGVPGQ VEPVFCNIRD 
DASVAAVMAG ADAVVNCVGV LNEVGKNTFS AVQSEGAGRI ARIAADTGVE RLVHVSAIGA 
DADGDSAYAR TKAEGEAAVL EAFPSAMILR PSIIFGPEDQ FFNRFASMTR FGPVLPIAGG 
TTRFQPVYVD DVAKAAVAGL TGQAAAGTYE LGGPEVKSFT ELMSQMLDVI HRRRLVVSLP 
NFVARLMAFG FDMAQAVTFG LFTNGLLTRD QLKNLQNDNV VSEGAKGLAD LGIEPVTMGS 
VLPDYLWKFR PSGQYDELMK SAGNLRGDI