Gene TM1040_3776 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3776
Symbol
ID	4074871
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008042
Strand	-
Start bp	22480
End bp	23481
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	54%
IMG OID	638004435
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_611171
Protein GI	99077912
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAACCG CTCTCATCAC CGGCACGGCT GGCTTCATTG GCTACCATCT TGCGACTTAT 
CTTCTAGCCT CAGGCTGGCA GGTTGTAGGG CTCGATTGTC TTTCACCTTA TTATGACATC 
GCCTTAAAAA GGCGCCGCCA CGCTATGCTG GAGGTCAACG ATAATTTCAT CCCTGTGATC 
GGCAAGCTCG AAGATCCAGG GCGCTTAATG GGCCTACTCG CTGACCACAA ACCCAATGCG 
GTGATCCATC TGGCCGCTCA AGCCGGAGTG CGCCATTCAA TTGACGCGCC GCGCGACTAT 
CTCGAGGCCA ACCTGATAGG TACTTTTGAA GTGCTGGAAG CTGCCCGCGC GCATCCGCCC 
GAGCATATAA TGATTGCCTC CACGTCTTCG GCTTATGGTG CCAATACCAA CATCCCTTTC 
GATGAGCACC AGAAAGCAGA TCATCAAATG TCATTTTATG CCGCCACCAA AAAGGCAGGC 
GAGACGATGG CTCATTCCTA TGCACACCTC TATGGTCTAC CAACCACGAT GTTCCGGTTC 
TTCACGGTGT ACGGCCCCTG GGGTCGACCG GATATGGCGT TGTTCAAGTT CACCAAAGCG 
ATAGAGGCCG GTGAGGCGAT CGATGTCTAT AACCATGGAC GCATGAGCCG AGACTTTACT 
TATATCGATG ATTTGGTGGC GGGTATCACC GGACTGATTG AGGCAGTGCC CGGTGATACG 
CCTGTCTCTA CGCAAGACAC CCTGAGCCCA GTTGCCCCTT TCAGGATCGT CAATATCGGG 
GCCTCAAAAC CCACGCCGCT GATGGATTAT ATTGCTGCGC TAGAAACCGC GCTAGAGACC 
ACCGCCCGAA AGAACTTGAT GGAGATGCAG CCAGGAGACG TGCCGGCAAC CTGGGCAGAC 
ACCACTTTGT TGAGCCAGCT TACCGGCTAT GAGCCTCAGG TTAGTGTCGA AGAGGGTGTC 
GCCCGTTTTG TCGCTTGGTA CCGAGGTTAT TATGCCAGCT GA

Protein sequence

MRTALITGTA GFIGYHLATY LLASGWQVVG LDCLSPYYDI ALKRRRHAML EVNDNFIPVI 
GKLEDPGRLM GLLADHKPNA VIHLAAQAGV RHSIDAPRDY LEANLIGTFE VLEAARAHPP 
EHIMIASTSS AYGANTNIPF DEHQKADHQM SFYAATKKAG ETMAHSYAHL YGLPTTMFRF 
FTVYGPWGRP DMALFKFTKA IEAGEAIDVY NHGRMSRDFT YIDDLVAGIT GLIEAVPGDT 
PVSTQDTLSP VAPFRIVNIG ASKPTPLMDY IAALETALET TARKNLMEMQ PGDVPATWAD 
TTLLSQLTGY EPQVSVEEGV ARFVAWYRGY YAS