Gene TM1040_2330 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2330
Symbol
ID	4078320
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2450310
End bp	2451701
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	61%
IMG OID	638007652
Product	threonine synthase
Protein accession	YP_614324
Protein GI	99082170
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.351518
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATATA TCTCCACCCG CGGCCAAGCG CCCGAACTCA CCTTCGAAGA AGCCATGCTG 
ACCGGGCTTG CGCGCGACGG CGGGCTTTAT GTTCCGGCAG AAATCCCGAC GCTCTCGGCA 
GAGGAAATCG CAGGCTTTGC CGGGCTGCCT TATGAGGAGG TCGCGTTTCG CGTGATGTGG 
CCCTATGTGT CGGGGTCTTT CTCCGAAGAG GAATTCAAGG GCATCATCGC GCGCGCCTAT 
GCCGGGTTTG AGCACGCCGC TCGCGCGCCG CTGAAACAGA TGGCGCCGAA CCACTTCCTG 
TTGGAGCTCT TTCACGGCCC GACGTTGGCG TTCAAGGATT TCGCCATGCA GCTCATCGGT 
CAGCTGTTTC AGGTCGCGCT CAAACGCCGG GGCGACAGCG TGACCATCGT GGGTGCCACT 
TCTGGCGACA CCGGGTCCGC GGCGATCGAG GCGTTTCGCG GTCTGGACGC GGTCAACGTC 
TTTATCATGT ATCCCCATGG CCGCGTCTCC GAGGTGCAGC GCCGCCAGAT GACCACACCG 
CAGGACGCCA ATGTGCATGC CCTCGCGGTG GATGGAGACT TTGACGACTG CCAGGCTGCG 
GTCAAAGACA TGTTCAACGA TTTTGACTTC CGCGATTCGG TGCATCTGGC GGGCGTGAAC 
TCGATCAACT TTGCCCGCGT TTTGGCGCAG GTGGTCTATT ACTTCACCGC TGCCGTGGCC 
TTGGGCGCAC CGCACCGCAA AGTGTCCTTC ACCGTGCCGA CCGGTAACTT TGGCGACATC 
TTTGCGGGCT TTATCGCGCG CCAGATGGGG CTGCCGATCG ATCAGCTGGT GGTCGCCACC 
AACCAGAACG ACATCCTGCA CCGCTGCCTC TCGGGCGAGG GCTATTTCAA AGGCGAGACC 
ATCCCGTCGA TTTCGCCTTC TATGGATATT CAGGTCTCTT CGAACTTCGA GCGGGCCTTG 
TTCTATGCCT ACGATCAGGA CGGCGCGGCT GTGGCGCAGC TGATGGACGA ACTGAAGACC 
GGTGGTGGTT TTAACGTGAG CCAGGGGGCC ATGCAGGCGT TGAGCGAAAT CTACAGCTCA 
GGCCGCGCTT CCGAGGAGGA GACTTCCGCC ACGATCAAAT CCGAACTCGC GGCCTCAGGA 
GAGCTGCTTT GCCCACATGG GGCAGTTGGG GTGAAGGTCG CCAATGAACA CCTCAAGGAT 
GGGGTGCCGA TGGTCACGCT GGCCACGGCG CATCCCGCAA AATTCCCGGC CGCGGTCGAG 
GCGGCCTCGG AGGTGCATCC GCCTCTTCCC CCTCGCATGG CAGACCTGTA TGACAGATCG 
GAGCGCGTGA CCCGGATCGC CAATGATCTC GGCGCGATTG AAGATCATAT CAGAAAGCAC 
ATCGCCAATT GA

Protein sequence

MKYISTRGQA PELTFEEAML TGLARDGGLY VPAEIPTLSA EEIAGFAGLP YEEVAFRVMW 
PYVSGSFSEE EFKGIIARAY AGFEHAARAP LKQMAPNHFL LELFHGPTLA FKDFAMQLIG 
QLFQVALKRR GDSVTIVGAT SGDTGSAAIE AFRGLDAVNV FIMYPHGRVS EVQRRQMTTP 
QDANVHALAV DGDFDDCQAA VKDMFNDFDF RDSVHLAGVN SINFARVLAQ VVYYFTAAVA 
LGAPHRKVSF TVPTGNFGDI FAGFIARQMG LPIDQLVVAT NQNDILHRCL SGEGYFKGET 
IPSISPSMDI QVSSNFERAL FYAYDQDGAA VAQLMDELKT GGGFNVSQGA MQALSEIYSS 
GRASEEETSA TIKSELAASG ELLCPHGAVG VKVANEHLKD GVPMVTLATA HPAKFPAAVE 
AASEVHPPLP PRMADLYDRS ERVTRIANDL GAIEDHIRKH IAN