Gene RoseRS_3080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_3080
Symbol
ID	5210048
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	3870694
End bp	3871734
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	65%
IMG OID	640596671
Product	threonine synthase
Protein accession	YP_001277393
Protein GI	148657188
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0615422
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.00256944
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCTGTTCG AACGCTATGG CGCATTTCTG CCATTGACCG GGCAAACGCC GCGCCTCAGC 
CTTGGCGAAG GCGATACGCC GCTGATTGCC GCACCCCGCC TGGCGCGCTC CATCGGCGTG 
CGTGAGTTGT ACCTGAAGTA CGAAGGCGCC AACCCGACCG GATCGTTCAA AGATCGCGGA 
ATGGTGGTGG CGGTCGCCAA AGCCATCGAA GCCGGCGCTA CCTCGGTCAT CTGCGCTTCG 
ACCGGCAATA CCTCGGCGAG CGCGGCGGCA TATGCGGCGC ATGCCGGCAT CGAGTCAATT 
GTGGTTGTGC CTGCCGGAAA GATCGCCCTG GGCAAACTGG CGCAGGCGCT GATGTATGGC 
GCGCGGTTGC TGGTGATCGA GGGCAACTTC GACGAAGCGC TGCGGATTGT GCGCGATCTG 
GCGCGGCAGT TTCCGGTGAC GCTGGTCAAC TCCGTCAATC CGCACCGCCT CGAAGGGCAG 
GCGACGGCAG CCTACGAGAT CTGTGATACG CTGGGTGGTC CGCCCGATGC GCTCTGTCTG 
CCGGTCGGCA ATGCGGGGAA TATCACCGCG TACTGGATGG GATTCCGCCG GTATTACGAA 
GCAGGCAGGA TCAACCGCCT GCCGAAGATG CTCGGCTTTC AGGCGGAGGG CGCAGCGCCG 
ATTGTGCACG GCGCTCCGGT GGAACATCCT GAGACGGTTG CGACCGCGAT CCGGATCGGC 
AACCCGGCGA GCTGGTGTTA TGCGCTCGAT GCGCGCGATC AGTCGGGAGG ATCGATCGAC 
GCCGTCAGCG ATGAGCAGAT CCTGCGGAGC TGGCGCGACC TGGCGCGCCT GGAAGGGGTA 
TTCGCGGAGC CGGCATCGGC AGCCGGCGTC GCCGGGTTGC GCAAAATGGT CGCCGAAGGG 
CGCGCCGATC CGGATGCATG CTATGTGGCG GTGCTGACCG GTCATGGACT GAAAGATCCC 
GGACTGGCGG TGGAGCAATT CGAGACGCCT CAGCCGGTGC CGGCGGATAT GAATGCCATT 
CTCCGATGGT TGGGCTGGTG A

Protein sequence

MLFERYGAFL PLTGQTPRLS LGEGDTPLIA APRLARSIGV RELYLKYEGA NPTGSFKDRG 
MVVAVAKAIE AGATSVICAS TGNTSASAAA YAAHAGIESI VVVPAGKIAL GKLAQALMYG 
ARLLVIEGNF DEALRIVRDL ARQFPVTLVN SVNPHRLEGQ ATAAYEICDT LGGPPDALCL 
PVGNAGNITA YWMGFRRYYE AGRINRLPKM LGFQAEGAAP IVHGAPVEHP ETVATAIRIG 
NPASWCYALD ARDQSGGSID AVSDEQILRS WRDLARLEGV FAEPASAAGV AGLRKMVAEG 
RADPDACYVA VLTGHGLKDP GLAVEQFETP QPVPADMNAI LRWLGW