Gene Dret_0117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0117
Symbol
ID	8417921
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	156078
End bp	157412
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	62%
IMG OID	645036682
Product	3-phosphoshikimate 1-carboxyvinyltransferase
Protein accession	YP_003196997
Protein GI	258404255
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0128] 5-enolpyruvylshikimate-3-phosphate synthase
TIGRFAM ID	[TIGR01356] 3-phosphoshikimate 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACCATG TGGAGGTCAC GGTCCCGGCA AGCAAGTCCC TCTCCCATCG GGCTTTGATT 
TGCGCTGGTC TGGCACTTGG AGTCAGTCGG GTGGAAAACG TCCTGGACAG TCAGGACCTG 
GACCGGACCC GTGCCTGTCT CGAAGCGCTG GGCACCCAAT TCGAGGTCGA GGCCGACGGA 
CTTGTGGTCC GAGGGCGCGG CGGTATCGGC CAGGTCAATC AGGCGAGTCT CGATGTCGGC 
GAATCCGGCA CCACCTGCCG CCTGCTCACG GCTGTGGCCG CAGCCGGTTC AGGGGTGTTT 
TCCCTTGCCG GGCAAGGTCG GATGCACCAG CGGCCCATCG CGCCGCTGGC TTCGGCTCTT 
CACCAACTCG GATGCCGCTT TGAATGGCTC GAGGCGGACG GCTTTCTGCC CTGCCGGGTG 
CATAGCTCAG GGCTCAAAGG GGGGCAGACG ACAGTGGCCC TGGATGAAAG CAGCCAATTT 
CTCTCCGGGT TGCTGCTGGC CTCGCCGCTG GCCTGTGATC CTCTGACTAT TGGGATCGGC 
GGACAGCGGG CCGTCTCCTG GCCCTATGTG GCCTTGACTC TTGAAGTGAT GCGTTTTTTT 
GGACAGGAGC CGATCCTGGA ACAAGCGCAC GGCGAGAGAT GGCACTCCGT GCCCTTTGAG 
AGCAATCCCT CCATCGAGCC AAGTAAAACG CGGTTTCGTT GCCATCCCGG GGTCTACTCG 
CCGCAACGCT ATCGGGTCGA GGGCGACTGG AGCAACGCGT CCTATTTCGT GGCCGCTGGT 
GCCATCGGGC CCCGCCCTGT GCGGTTGCGT GGTTTGTATA AGGATTCTCG CCAGGGCGAT 
CGGGTCATTG TGGACATCGT CAAACAATTC GGTGCGTACG TTGAGTGGGG GCGGGAGTCG 
CTGGTCGTCG CTCCTGGACC TCTTCAGGGG CAGGAATTGG ACATGGGCCC TTGCCCGGAT 
CTCGTCCCGA CGGTGGCGGT GATGGCCAGT CTGGCGGAAG GCCCCACGGT GATCAAGAAT 
ATCGCGCATC TGCAGCTCAA GGAGAGCGAC CGTCTCAATG GCGTGGCCAA TGAGTTGCGC 
AAGGCCGGGG CCGAGGTCAC CGTTGAAGCG GATACCCTGA CGATCATCCC CTGTCCGCTG 
GGGACCAAAC CGCTGCGATT GTCGACTTAT GATGATCACC GTATGGCCAT GGCCCTTTCC 
CTGTTCCAGT TGGCCGGGTT GCATCTCCAA TTAGACAATC CCGGTTGCGT GGCCAAATCC 
TTTCCCCGCT TCTGGGAACA ATGGGACAAG GTCCGTCAGG CATCGGAAGG AACGTCCGAA 
AGGCCTGGAA ATTGA

Protein sequence

MYHVEVTVPA SKSLSHRALI CAGLALGVSR VENVLDSQDL DRTRACLEAL GTQFEVEADG 
LVVRGRGGIG QVNQASLDVG ESGTTCRLLT AVAAAGSGVF SLAGQGRMHQ RPIAPLASAL 
HQLGCRFEWL EADGFLPCRV HSSGLKGGQT TVALDESSQF LSGLLLASPL ACDPLTIGIG 
GQRAVSWPYV ALTLEVMRFF GQEPILEQAH GERWHSVPFE SNPSIEPSKT RFRCHPGVYS 
PQRYRVEGDW SNASYFVAAG AIGPRPVRLR GLYKDSRQGD RVIVDIVKQF GAYVEWGRES 
LVVAPGPLQG QELDMGPCPD LVPTVAVMAS LAEGPTVIKN IAHLQLKESD RLNGVANELR 
KAGAEVTVEA DTLTIIPCPL GTKPLRLSTY DDHRMAMALS LFQLAGLHLQ LDNPGCVAKS 
FPRFWEQWDK VRQASEGTSE RPGN