Gene Sare_4032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4032
Symbol
ID	5705012
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4587996
End bp	4589045
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	69%
IMG OID	641273457
Product	threonine synthase
Protein accession	YP_001538813
Protein GI	159039560
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.969378
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000421032
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTGGCGGG GCCTGATCGA CACGTACCGG GATCGGCTGC CGGTCACCGC GGCCACCCCG 
GTCGTCACCC TGCACGAGGG GAACACCCCG CTGCTGCCGG CACCGTTGCT GTCGGCGCGG 
ACGGGGTGCG ACGTCTACCT GAAGGTTGAG GGTGCCAATC CGACCGGTTC CTTCAAGGAC 
CGGGGGATGA CCGTCGCCGT CTCCAAAGCG GTCGAGGACG GCAACAAGGT GATCATCTGT 
GCCTCGACCG GTAACACCAG TGCCTCGGCC GCCGCGTACG CGGCGCGAGC CGGTCTGGTC 
TGTGCGGTAC TGGTGCCGCA GGGCAAGATC GCCTTGGGCA AGCTCGCTCA GGCGTTGGTG 
CACGGTGCCC GGCTGCTTCA GGTCAGCGGC AACTTCGACG ACTGCCTGTC GTTGGCCGCC 
AAGCTCGCCC AGGACTACCC GGTCGCCCTG GTGAACTCGG TGAACACCGA CCGCCTGCAC 
GGCCAGAAGA CCGCCGCGTT CGAGATCGTC GAGGCGCTCG GCGACGCGCC CGACATCCAC 
TGCATGCCGG TAGGAAACGC GGGCAACATT TCCGCCTACT GGCTCGGCTA CTCGGAGGAA 
CGGGCGGCGG GCAACGTCTC CCGGGTCCCG AAGCTCTTCG GGTTCCAGGC CGCTGGCGCC 
GCGCCGATCG TCACCGGTCA GGCGGTTCGG GAACCCGCCA CGATCGCCAC CGCGATCCGG 
ATCGGCAATC CGGCGAGCTG GACGAGAGCG CTGGACGCCC GGGACTCCTC GGGCGGCCTG 
ATCGCCGCGG TCACCGACCG GGAGATTCTG ACCGCGTACC GGTTGCTCGC TCGGGAGGTC 
GGGGTGTTCG TCGAGCTGGG CAGTGCGGCG AGTGTCGCTG GGCTGCTCCA GCAGGCCGCC 
GTGGGCAAGG TGCCGGCTGG GTCGACGATT GTCTGTACGG TCACCGGACA TGGCCTGAAG 
GATCCGGAGT GGGCCATCTC GACCGCCCCC GCGCCGGTGA CCATCGCCAA CGACCCCCTG 
GCCGCGGCCC GCTCTCTCGA TCTGGTCTGA

Protein sequence

MWRGLIDTYR DRLPVTAATP VVTLHEGNTP LLPAPLLSAR TGCDVYLKVE GANPTGSFKD 
RGMTVAVSKA VEDGNKVIIC ASTGNTSASA AAYAARAGLV CAVLVPQGKI ALGKLAQALV 
HGARLLQVSG NFDDCLSLAA KLAQDYPVAL VNSVNTDRLH GQKTAAFEIV EALGDAPDIH 
CMPVGNAGNI SAYWLGYSEE RAAGNVSRVP KLFGFQAAGA APIVTGQAVR EPATIATAIR 
IGNPASWTRA LDARDSSGGL IAAVTDREIL TAYRLLAREV GVFVELGSAA SVAGLLQQAA 
VGKVPAGSTI VCTVTGHGLK DPEWAISTAP APVTIANDPL AAARSLDLV