Gene Mmar10_1146 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_1146
Symbol
ID	4285710
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	+
Start bp	1254580
End bp	1255851
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	66%
IMG OID	638140626
Product	threonine dehydratase
Protein accession	YP_756377
Protein GI	114569697
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01127] threonine dehydratase, medium form

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0807272
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.0946601
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCTAA CTGCCCGTTC GACAGCCCCT TTGCCAGACT GCCCACCGCA AGAAGCCACC 
GCGCTGTCTG CTGCGTTCGA CCATGTCGAC ACGCTGCGGC GGGACGGGTT TGGCGGCATT 
CTGCGTGCCC CGATGGTCGC ATCGCCGGTC CTGTCGGCGA GCGCGGGATG CGACCTGTGG 
GTCAAGCTGG AAAACCTTCA GGTCACCGGC TCGTTCAAGG AGCGCGGCGC GTTTGCCCGC 
ATGGCCGCCC TCAGTGCGGA TGAGCGCCGC AGGGGCGTTG TCGCGGCGTC GGCGGGCAAT 
CATGCCCAGG GTGTGGCACG CAGCGCCGGG GCGATGGGTA TAGCGGCCCG GATCTACATG 
CCGGTGGGAA CGCCGACCGT GAAGGTCAAT GCGACCCGCG CCCTGGGCGC TGAGGTCGAG 
TTGGCCGGCG ATGATTTTGA TGCGGCCAAG GCGCTTGCTG TCGCCGCAGC CGAGACCAGC 
GGTGCCGTCT TCATCCACCC CTTCGATGAC CCTGTCGTGC TGGCCGGGCA GGGAACGGTG 
GCGATGGAAA TGCTGGAGGA CCAGCCCGAC CTCGACGTGC TGGTCTTCCC GGTCGGCGGC 
GGCGGGCTGG CGGCGGGCGC CGGGCTGGCG GCGCGGCGGA TCAAGCCGGA CATCGAACTG 
GTGGGTGTGC AGTCCGACCT TTTCCCGGCC TTTGCCAATC TCTTTCACGA CGCCGACCGG 
CCGGTCGGTG GTTTCACCCT CGCTGAAGGC ATTGCCGTGC GTCAGCCCGG TGATCTGACC 
AGCGCGATAT TGAAGACCCT GCTCGATGAT GTCCTGCTGG TGGACGAGCG CCAGATCGAG 
CACGCGCTCA ATCTCTTCAT CGCGCAGATG CGGGTCCTGC CGGAAGGGGC GGGCGCTGTC 
GGGCTTGCTG CCGTCCTCGC CCACAAGCAA CGCTTTGCCG GCAAGAAGGT CGGCCTCGTC 
CTGTCCGGCG GCAATGTCGA TACAAGGCTC TTGTCATCGC TCCTGCTGCG CGACCTGGCC 
CGATCGCGCC GGCTAGCCCG CTTCCGCATC GAGCTGGTCG ATATTCCCGG GCAGTTGTCG 
AGCGTGTCGG AGATCATCTC CGAGGCCGGT GGCAATGTCA CCGATGTCGC CTATCACAAG 
ACATTCTCGG ACCTGCCAGC CAAGGTGACC TATATCGATA TCTCGCTGGA GGCGCAGGAT 
GGCGCCCATA TGGACCGGAT CCAGGCGGCC CTGCAGGCGG CCGGCTTCCG GGTCGAACTG 
GCGGGCTACT GA

Protein sequence

MSLTARSTAP LPDCPPQEAT ALSAAFDHVD TLRRDGFGGI LRAPMVASPV LSASAGCDLW 
VKLENLQVTG SFKERGAFAR MAALSADERR RGVVAASAGN HAQGVARSAG AMGIAARIYM 
PVGTPTVKVN ATRALGAEVE LAGDDFDAAK ALAVAAAETS GAVFIHPFDD PVVLAGQGTV 
AMEMLEDQPD LDVLVFPVGG GGLAAGAGLA ARRIKPDIEL VGVQSDLFPA FANLFHDADR 
PVGGFTLAEG IAVRQPGDLT SAILKTLLDD VLLVDERQIE HALNLFIAQM RVLPEGAGAV 
GLAAVLAHKQ RFAGKKVGLV LSGGNVDTRL LSSLLLRDLA RSRRLARFRI ELVDIPGQLS 
SVSEIISEAG GNVTDVAYHK TFSDLPAKVT YIDISLEAQD GAHMDRIQAA LQAAGFRVEL 
AGY