Gene TM1040_3873 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3873
Symbol
ID	4074936
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008042
Strand	+
Start bp	127810
End bp	128979
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	57%
IMG OID	638004530
Product	mannonate dehydratase
Protein accession	YP_611265
Protein GI	99078006
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1312] D-mannonate dehydratase
TIGRFAM ID	[TIGR00695] mannonate dehydratase

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.432429
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGAAA CCTGGCGCTG GTTCGGCCCG AATGACCCCG TAACACTGAC CGACATTCGT 
CAGGCCGGGG CTACTGGCGT TGTAACGGCA CTGCACTCTC TCCCCAATGG TACCGTATGG 
CCAGTCGAGG AGATTGTCGC ACGCCGTGAC ATGATCACCG CTGCCGGCCT CAACTGGGAT 
GTAGTCGAAA GCGTGCCCGT TCACGAAGAC ATCAAACGCG CAGCACCAGG GTGGGAAGAA 
AAGGCGGACG CGTGGGCACA ATCTATACGC AACCTCGCAG CCTGTGGCAT TAAAACTGTG 
TGCTATAATT TCATGCCGCT GTTGGATTGG ACCCGAACAG ACCTGACGCA CCCCCTTTCT 
GATGGTGCGC TGTGCCTACG GTACGACGCA GTGGATGCGG CAGTGTTTGA TATTCATATC 
CTCACCCGGG TCGGCGCTGA TGCAGAACAT AGGCCGGAGA TCGTACAACG CGCAACTGAG 
CGCTTTACCA AGATGACAGA AACGGAATGC GAGGCACTAA CGCAGACCAT CCTCGCCGGA 
CTACCCGGGG CTGAAGAGAG CTTTGACATC AATAGCTTCC GATCACATCT TGCTCTTTAC 
AACGATATTG ATGCGACCAG ACTGCGGGCT AACCTGGCCG CCTTCCTTCA ACGTGTAGTG 
CCTGTGGCGG AAGAGGTGGG CGTCAGGTTG GGGATCCATC CAGACGACCC CCCCTTCCCC 
ATTTTTGGCC TACCACGTGT AGTTTCTACC GCGGAGGATT TGGACCACAT CATCCAGGTT 
TACGAAAGCC CCTCAAACGG CCTGACGTTT TGTACCGGAT CGCTGGGCGT GCGTGCGGAC 
AATAATCTAC CGGCCATGCT GACGCGCTTC GGGAAGCATG TAAATTTTCT CCACCTGCGC 
GCCACACAGC GCGAGGAGGA TGGTATCAGT TTTCACGAAG CCCCTCATCT GCTCGGCAAC 
GTCGATATGG TCGCAGTATG TAAGGCCGCG CTGGCCGCAG AGGCCGTAGG GGATCGCGAG 
CTACCATTCC GGCCAGACCA CGGCCATATG CTCGCCCATG ATCAACGCGT CAGTAGTACT 
CCGGGCTATC CCTACATTGG GCGCTTGCGT GGCCTGGCAG AATTGAGGGG AGTACTCCAC 
ACGCTAGCTT GGCTACAAAA AGACGACTGA

Protein sequence

MIETWRWFGP NDPVTLTDIR QAGATGVVTA LHSLPNGTVW PVEEIVARRD MITAAGLNWD 
VVESVPVHED IKRAAPGWEE KADAWAQSIR NLAACGIKTV CYNFMPLLDW TRTDLTHPLS 
DGALCLRYDA VDAAVFDIHI LTRVGADAEH RPEIVQRATE RFTKMTETEC EALTQTILAG 
LPGAEESFDI NSFRSHLALY NDIDATRLRA NLAAFLQRVV PVAEEVGVRL GIHPDDPPFP 
IFGLPRVVST AEDLDHIIQV YESPSNGLTF CTGSLGVRAD NNLPAMLTRF GKHVNFLHLR 
ATQREEDGIS FHEAPHLLGN VDMVAVCKAA LAAEAVGDRE LPFRPDHGHM LAHDQRVSST 
PGYPYIGRLR GLAELRGVLH TLAWLQKDD