Gene Saro_1100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1100
Symbol
ID	3916396
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1141884
End bp	1143149
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	68%
IMG OID	640443835
Product	threonine dehydratase
Protein accession	YP_496379
Protein GI	87199122
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01127] threonine dehydratase, medium form

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAATG CAGCGCTCAC GCCCGTAGTG CAGGGGGCCG CCGACGACGC GGACGCCCTG 
CTGACTCTCG CCGACGTTCG TGCGGCGGCG GAGCGCATTG CCGGCCAGGT GGTGCGCACC 
CCGACCCTGC ACAGCAAGAC GCTGAGCGCG ATTACCGGCG CGAACATCTG GATCAAGTTC 
GAGAACCTGC AGTTCACCGC CGCCTACAAG GAGCGAGGTG CGCTCAATGC CCTGCTGCTC 
CTTTCGCAGG AACAGCGCGC GCGGGGCGTG ATCGCCGCGT CGGCGGGAAA CCACGCGCAG 
GGGCTTTCCT ACCACGGAAC CCGCCTGGGC GTTCCCGTGA CCATCGTCAT GCCGCGCACG 
ACGCCGACGG TGAAGATCAT GCAGACCGAG GCCGTGGGCG GCAAGGTCGT GCTCGAGGGC 
GAGACCTTCG ACGAGGCCTA TGCCCATGCG CGCAAGCTGG AGCGCGAACT GGGACTGACG 
TTCGTCCACC CGTTCGACGA GCGCAATGTC GCGGCCGGAC AGGGTACGGT CGCGCTCGAG 
ATGCTCGAGG ATGCGCCCGA GATCGACATG CTGGCCGTTC CCATCGGTGG CGGTGGCCTG 
CTTTCGGGCA TGGGCACGGC GGCGCGCGGG ATCAAGCCGG AGATCGGCCT GATCGGCGTG 
CAGGCACAGC TCTTCCCGTC GATGTTCGCG CGGCTCAAGC ACCTCGATTT GCCATGCGGC 
GGCGATACGC TGGCCGAGGG CATCGCGGTG AAGGAGCCGG GGGCGTTCAC CTCCGCCGTG 
CTGCGCGATC TGGTCGACGA TGTGGTGCTG GTGAACGAAG CCGCGCTGGA ATCGGCCGTG 
GCGCTGCTGC TCCAGATCGA GAAGACCGTG GTCGAAGGCG CGGGCGCCGC GGGGCTGGCG 
GCGGTGATGC AGAACCGGGA GCTGTTCGCG GGCCGCAACG TGGGCGTCGT GCTGACGGGC 
GCGAACATCG ATACGCGCCT GCTGGCCAAC GTGCTGCTGC GCGATCTTGC ACGGTCGGGG 
CGCCTCGGCC GCCTGCGCAT CACATTGCAG GACCGTCCTG GCGCGCTGTT CAAGGTGGTC 
GAGGAGTTCA ACCGTCACCA GGTGAACATC CTTGAAGTTT GGCACCAGCG CATCTTCACT 
TCGCTGCCGG CCAAGGGCCT GACCGCCGAG ATCGAGTGCG AGGCGCGCGA TCGCGAGCAG 
ATCGACCGGC TCGTCGCCGG GCTGCGCGGC AAGGGCTACG ACGTCGAGCA GGTCGAACTG 
GGGTAG

Protein sequence

MENAALTPVV QGAADDADAL LTLADVRAAA ERIAGQVVRT PTLHSKTLSA ITGANIWIKF 
ENLQFTAAYK ERGALNALLL LSQEQRARGV IAASAGNHAQ GLSYHGTRLG VPVTIVMPRT 
TPTVKIMQTE AVGGKVVLEG ETFDEAYAHA RKLERELGLT FVHPFDERNV AAGQGTVALE 
MLEDAPEIDM LAVPIGGGGL LSGMGTAARG IKPEIGLIGV QAQLFPSMFA RLKHLDLPCG 
GDTLAEGIAV KEPGAFTSAV LRDLVDDVVL VNEAALESAV ALLLQIEKTV VEGAGAAGLA 
AVMQNRELFA GRNVGVVLTG ANIDTRLLAN VLLRDLARSG RLGRLRITLQ DRPGALFKVV 
EEFNRHQVNI LEVWHQRIFT SLPAKGLTAE IECEARDREQ IDRLVAGLRG KGYDVEQVEL 
G