Gene Rcas_1481 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1481
Symbol
ID	5538956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	1893908
End bp	1895203
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	64%
IMG OID	640893619
Product	3-phosphoshikimate 1-carboxyvinyltransferase
Protein accession	YP_001431593
Protein GI	156741464
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0128] 5-enolpyruvylshikimate-3-phosphate synthase
TIGRFAM ID	[TIGR01356] 3-phosphoshikimate 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.826283
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCATA CGATGATTGC GCCGCGACGG TTACGCGGCA TTATCGATCT CCCCGGCGAT 
AAATCGATTT CGCACCGCGC TGTGCTGTTG AATGCGATAG CAACCGGTGC GGCTGAAGTT 
GCGAACTTTC TCACCGGCGC CGACTGTCTG TCGACGATTG CATGCGTTCA GGCGCTTGGC 
GTGCGCGTCG AGCGCCATGA GGACACGGTG CGGGTGTTTG GCGCGGGGTT GCGCAGCCTG 
CGCGAGCCGG TCGATGTGCT GGACTGCGGC AACTCCGGCA CAACGCTGCG CCTTTTGACG 
GGTATGCTTG CCGGTCAGGA GGGGATATTT GCCGTGTTGA CCGGCGATGC CTCGCTCCGT 
TCGCGACCGC AGCAACGGAT TGTGGCGCCG CTGCGCGCGC TTGGCGCTAC TCTCGACGGG 
CGGGATCGGG GGAATCGCGC GCCGCTGGTG GTGCGCGGCG CGTATCTTCA CGGCGGCGCA 
TACGATCTGC CGATTGCCTC GGCGCAGGTC AAGAGCGCCC TGCTGCTGGC GGCGTTGTTC 
GGCGACGGAA CGCTCACACT GACCGGACGC ACCGATGGAC GCGATCACAC CGAACGCATG 
CTGGCAGCCA TGGGGGCAAC AATCACGGTT GATGGACAGA CCATCCGGTT GACGCCGCCG 
GATCGTTCCG AAGCGCTGCA CCCGTTGTCG TTGCGAGTTC CGGGCGATCC GTCATCGGCG 
ACGTTCTGGT GGGTGGCAGC CGCGCTCCAT CCCGACGCCG AACTGACAAC GACGGGCGTT 
TGCCTGAACC CGACGCGCAC CGGCGCACTC GACGCGCTCC GCGCCATGGG AGCGCAGATC 
GACGTGGCGA ATCAGCGTGT CGAAGGCGGC GAACCGGTGG GTGATGTGAC TGTGCGTTCT 
TCGTCTTTGC ACGGCATTGT GATTGAAGGA GCGCTTATTC CGCGCCTGAT CGACGAACTG 
CCGGTTCTGG CGCTCGCAGC CGCCTGCGCT GAAGGCGAAA CGATCATCCG CGACGCACAG 
GAATTGCGCG TCAAAGAAAC CGATCGCATC GCTACGGTTG TGGCGGGATT GACGGCGCTC 
GGCGCAGTCG TGGAGCCGAC AGAAGACGGC ATGATCATTG CAGGCGGCGG CAACCTGCGC 
GGCGCTACGC TCGAAAGCCA CGGCGACCAT CGCCTGGCGA TGACGTGGGC GATTGCCGGT 
CTTGTAGGAG CAGGTGAAAC AACGCTGCAT GGCGCGGAAG CGGTAGATGT GTCATACCCG 
GAGTTTTGGA ATGTGCTGAG GCGGATACGT GAGTGA

Protein sequence

MIHTMIAPRR LRGIIDLPGD KSISHRAVLL NAIATGAAEV ANFLTGADCL STIACVQALG 
VRVERHEDTV RVFGAGLRSL REPVDVLDCG NSGTTLRLLT GMLAGQEGIF AVLTGDASLR 
SRPQQRIVAP LRALGATLDG RDRGNRAPLV VRGAYLHGGA YDLPIASAQV KSALLLAALF 
GDGTLTLTGR TDGRDHTERM LAAMGATITV DGQTIRLTPP DRSEALHPLS LRVPGDPSSA 
TFWWVAAALH PDAELTTTGV CLNPTRTGAL DALRAMGAQI DVANQRVEGG EPVGDVTVRS 
SSLHGIVIEG ALIPRLIDEL PVLALAAACA EGETIIRDAQ ELRVKETDRI ATVVAGLTAL 
GAVVEPTEDG MIIAGGGNLR GATLESHGDH RLAMTWAIAG LVGAGETTLH GAEAVDVSYP 
EFWNVLRRIR E