Gene TM1040_0029 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0029
Symbol
ID	4076296
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	29083
End bp	30393
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	57%
IMG OID	638005316
Product	xylose isomerase
Protein accession	YP_612024
Protein GI	99079870
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2115] Xylose isomerase
TIGRFAM ID	[TIGR02630] xylose isomerase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.280107
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.273997
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACTG GTTTTTTTGG CGATGTTTCC AAGATCACGT TCGAAGGGGC AGACAGCACC 
AACCCGCTGG CGTTTCGACA TTACAATCCC GACGAGGTGA TCCTCGGTAA GCGGATGGAA 
GAGCATCTGC GGTTTGCAAC CTGCTACTGG CACAACTTTG TGTGGCCGGG CGGTGATCCG 
TTTGGTGGTC AGACCTTTGA TCGCCCTTGG TTCAAGGACA CGATGCACGC CGCCAAGCTC 
AAGGCCGATG TGGCCTTTGA GATGTTCACG CTGCTGCAGT CGCCCTACTA CTGCTTCCAC 
GATGCGGACG TGCGGCCTGA AGGGGCGAAC TTTGCGGAAA ACACACGCAA TCTCAACGAG 
ATCGTCGACT ACTTCGCGCA GAAGCAGGAA GAGACCGGCG TGAAGCTCCT CTGGGGCACC 
GCGAACCTCT TTTCAAACGC CCGCTACATG TCTGGGGCGT CGACCAACCC GGATCCGGAC 
GTCTTTGCGT TTTCGGCGGC GACGATCAAA ACCTGCATGG ATGCCACCCA CCGTTTGGGC 
GGCGAGAACT ATGTGCTCTG GGGCGGTCGC GAAGGCTATG AGACGTTGCT GAACACCGAC 
CTCGCACAGG AAGATCAGCA AATGGGCCGG ATGCTCAACA TGGTGGTCGA GTATAAGCAT 
AAGATTGGCT TCAAAGGCGC GATCCTTGTG GAACCCAAGC CGCAGGAGCC CTCCAAACAT 
CAGTACGATT ACGACGCGGC CACCGTTTAC GGTTTCCTCA AGCGTCACGG GCTTGAAAAC 
GAGGTGAAGC TCAATCTCGA ACAGGGGCAT GCGATTCTTG CGGGCCATTC GTTTGAACAC 
GAAATCGCAA CGGCGCAAGC GCTGGGCATT TTTGGCTCGA TCGATATGAA CCGCAATGAT 
TACCAGTCGG GCTGGGATAC AGATCAGTTC CCCAACAATA CGCCCGAGGT GGCGCTGGCC 
TATTACCACA TCCTGAAGCA TGGCGGGTTC ACGACAGGGG GCACCAACTT TGATGCCAAG 
CTGCGCCGTC AGTCCATCGA TGCCGAGGAT CTCTTGATGG CGCATATCGG CGGCATGGAC 
ATCTGTGCGC GTGGCTTCAA GGCGGCTGCG GCTATGATCG AGGACGGTAC CTTGGATCAA 
TTTGTTACCG ACCGCTATGC AGGCTGGCAG ACCGATCCGG CGCAGGACAT GCTGGCGGGC 
AAACTCTCGC TTGATGAGAT TGCAAAGCGT GTCGAGGCCG AAGATATCAA TCCCAAGCCG 
CGCTCCGGGC GGCAGGAATA TCTTGAGAAC CTCATCAACC GGTTTGTCTG A

Protein sequence

MTTGFFGDVS KITFEGADST NPLAFRHYNP DEVILGKRME EHLRFATCYW HNFVWPGGDP 
FGGQTFDRPW FKDTMHAAKL KADVAFEMFT LLQSPYYCFH DADVRPEGAN FAENTRNLNE 
IVDYFAQKQE ETGVKLLWGT ANLFSNARYM SGASTNPDPD VFAFSAATIK TCMDATHRLG 
GENYVLWGGR EGYETLLNTD LAQEDQQMGR MLNMVVEYKH KIGFKGAILV EPKPQEPSKH 
QYDYDAATVY GFLKRHGLEN EVKLNLEQGH AILAGHSFEH EIATAQALGI FGSIDMNRND 
YQSGWDTDQF PNNTPEVALA YYHILKHGGF TTGGTNFDAK LRRQSIDAED LLMAHIGGMD 
ICARGFKAAA AMIEDGTLDQ FVTDRYAGWQ TDPAQDMLAG KLSLDEIAKR VEAEDINPKP 
RSGRQEYLEN LINRFV