Gene Rcas_3186 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3186
Symbol
ID	5540684
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	4142639
End bp	4143679
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	64%
IMG OID	640895307
Product	threonine synthase
Protein accession	YP_001433258
Protein GI	156743129
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000625844
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.196815
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTTCG ACCGCTATGG CGCATTTCTG CCGCTCACGG AGCAAACGCC GCGCCTCAGC 
CTTGGCGAAG GCGATACGCC ATTGATCCAC GCGCCGCGCC TGGCGCGCGC CATTGGGGTA 
CGCGAGTTGT TTCTGAAATA TGAGGGCGCC AACCCGACCG GCTCGTTCAA GGATCGCGGC 
ATGGTCGTAG CCGTCGCCAA AGCCCTCGAA GCGGGCGCAA CCTCGGTGAT CTGCGCTTCG 
ACCGGCAACA CCTCCGCCAG TGCGGCGGCG TATGCGGCGC ATGCCGGGAT TGAGTCGATC 
GTCGTGGTGC CTGCCGGAAA AATTGCGCTT GGCAAACTGG CGCAGGCGCT GATGTACGGC 
GCGCGGCTGC TGGTGATCGA GGGCAACTTC GACCAGGCGT TGCACATAGT GCGCGACCTG 
GCGCAGACGT ATCCGGTCAC CATTGTCAAC TCGGTGAACC CCTACCGCCT TGAAGGGCAG 
GCAACCGCCG CCTACGAAAT CTGCGATGCA CTCGGCGGTC CGCCAGACGC GCTCTGCCTG 
CCGGTCGGCA ACGCCGGGAA CATCACTGCG TACTGGATGG GGTTCCGTCG CTATCACGAG 
GCGGGGCGCA TCGACCGATT GCCGAGAATG CTCGGTTTCC AGGCGGAAGG CGCTGCACCG 
ATTGTGCGCG GGCATCCGGT CGAACACCCG GAAACCATCG CAACCGCGAT CCGCATCGGC 
AACCCGGCCA GTTGGTGCTA CGCACTCGAT GCGCGCGATC AGTCGGGCGG GTTGATCGAC 
TGGGTGAGCG ATGATCAGAT TCTCCAAAGC TGGCGTGATC TGGCGCGCCT GGAAGGGGTG 
TTCGTCGAAC CGGCATCGGC AGCCGGCATC GCCGGGTTGC GCAGAGTCAT CGCCGAAGGA 
CGCGCCGAAC CGAATGCGCG CTATGTGGCG GTGCTCACCG GTCATGGACT GAAAGACCCG 
GGGCTGGCGG TTGAACAATT CGATGTTCCT GAGCCGACGC CGGCGGACAT GGACGCCATT 
CTTCGATGGT TGGGCTGGTA G

Protein sequence

MLFDRYGAFL PLTEQTPRLS LGEGDTPLIH APRLARAIGV RELFLKYEGA NPTGSFKDRG 
MVVAVAKALE AGATSVICAS TGNTSASAAA YAAHAGIESI VVVPAGKIAL GKLAQALMYG 
ARLLVIEGNF DQALHIVRDL AQTYPVTIVN SVNPYRLEGQ ATAAYEICDA LGGPPDALCL 
PVGNAGNITA YWMGFRRYHE AGRIDRLPRM LGFQAEGAAP IVRGHPVEHP ETIATAIRIG 
NPASWCYALD ARDQSGGLID WVSDDQILQS WRDLARLEGV FVEPASAAGI AGLRRVIAEG 
RAEPNARYVA VLTGHGLKDP GLAVEQFDVP EPTPADMDAI LRWLGW