Gene TM1040_3866 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3866
Symbol
ID	4074929
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008042
Strand	-
Start bp	118357
End bp	119772
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	57%
IMG OID	638004523
Product	fructuronate reductase
Protein accession	YP_611258
Protein GI	99077999
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0246] Mannitol-1-phosphate/altronate dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	52
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.154848
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAATT CTCTTATCCC TTGTTCTTAC GAACAAACCC TGCTCAAGCC GCGTATTCTG 
CATATCGGCT TTGGTGCTTT TGCCCGTGCC CACCCTATGG TCTATCTTCA CCATGGGCTT 
GTGGCCGAGG GTGGCGATTG GGGTGTGGTC GCTGCGCGAC TGAATTCCGG AGTGGATGCG 
TTGGACAGCT TGGACGCAGT CCAGGGGCGA TATCACATCG CCGAAGCCGA TGGTGACACT 
ATAACACTAC GAGAAATCGG CCTCTTGTGT GGCACCTGTC ACCCCGCCCG CGACGGGGTA 
GATGCTATCC CCGCGTTAAT CGCGTCTCCA GATATGTCTG TGATCTTGTT GACCATTACC 
GAAAAAGGGT ACTGTACAAA GGATGGCCAG CTCGACCTGA CGCAAGCCGC TATACAGGCT 
GAGTTGGACG GCGGGTTGCC GACCACTGCC ATCGGTGTGT TGGTGTCAGG CTTGGAGCGC 
CGGCGCGCGG CAGATCTTGG CGGAATCACG ATCTTGTCTT GTGACAATCA GCCGGATAAC 
GGCGCGCTCA CTCGCGCCGC TGTGCTGGGG TTTGCTGAGG AATTGGATCT AAATCTTGCG 
GAATGGATTA GAACCCATGT TCGGTTCCCC TCGTCGATGG TGGACCGGAT CGTGCCTGCC 
ATGACCGATG ACAGTCATAC AGCGGTCGCA TCCGCACTTG GCCGAGATGA CCCCAATGCG 
GTTTTGTGTG AACCCTTCAG ACAGTGGGTG ATTGAAGATG ACTTTGCCAA TGAGCGCCCC 
CCCTTTGCAG AGGGTGGTGC TATGTTGGTT GCAGACGTAC AGCCGTTTGA GGAAATGAAA 
CTAAGACTGC TCAATGGTGC GCATACCACT TTGGCTTGGC TGGGTCAGTT GCTGGGATAT 
CAAACAGTGG CCGACTGCAT GGCTGACAAG GAGCTGCGTG CTTTAATCCG CCACCTAATG 
TTGGCTGAGC AGGCCGCAAC ACTGCGTCCA CTCGAGGGTA TCGATCTCGC AGCCTATGCG 
GATGAGTTAT TAAAACGGTT TGAAAACACC CGGCTCCGGC ATCGACTAGA CCAGATCGCC 
AGCGACAGCA GCCAGAAGAT GCCGCAACGC CTGTTCGCTC CGATAGCTAT TAACCTCGAA 
GCCAAACGCG AGTGGTCGGT TTCAGCCTTG GCGGTGGCTG CTTGGATCAA AGGGTTGGGT 
AGCCTTCCTC CTGTTCCGGA TCCTCGACAG GATGAGTTGC GTCGTGCCGC TCTTTGCAAT 
GACCCAGTCG CGGCGGTTCT GTCGCTACCC TCCTTGGTTC CAGACGCGCT GCGTCCGCTA 
GCAGAGTTCC AAGCCGCTAT TAGCGTGGCC TTTGAGCGAT TGCAGGGCGG GGCAAAGGCG 
ACCGTGACAA CCACCGCGAA GGAACTACGC AGATGA

Protein sequence

MTNSLIPCSY EQTLLKPRIL HIGFGAFARA HPMVYLHHGL VAEGGDWGVV AARLNSGVDA 
LDSLDAVQGR YHIAEADGDT ITLREIGLLC GTCHPARDGV DAIPALIASP DMSVILLTIT 
EKGYCTKDGQ LDLTQAAIQA ELDGGLPTTA IGVLVSGLER RRAADLGGIT ILSCDNQPDN 
GALTRAAVLG FAEELDLNLA EWIRTHVRFP SSMVDRIVPA MTDDSHTAVA SALGRDDPNA 
VLCEPFRQWV IEDDFANERP PFAEGGAMLV ADVQPFEEMK LRLLNGAHTT LAWLGQLLGY 
QTVADCMADK ELRALIRHLM LAEQAATLRP LEGIDLAAYA DELLKRFENT RLRHRLDQIA 
SDSSQKMPQR LFAPIAINLE AKREWSVSAL AVAAWIKGLG SLPPVPDPRQ DELRRAALCN 
DPVAAVLSLP SLVPDALRPL AEFQAAISVA FERLQGGAKA TVTTTAKELR R