Gene Franean1_0958 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0958
Symbol
ID	5669372
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	1121846
End bp	1123225
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	77%
IMG OID	641239886
Product	3-phosphoshikimate 1-carboxyvinyltransferase
Protein accession	YP_001505320
Protein GI	158312812
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0128] 5-enolpyruvylshikimate-3-phosphate synthase
TIGRFAM ID	[TIGR01356] 3-phosphoshikimate 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0792374
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0544047
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAGCGCG GGCAGGACGA CCCGTGGTCG GCTCCGGTCG CGACCGGTCC GGTCCGGGCG 
ACCGTCACCG TGCCGGGCTC GAAGTCCGGC ACGAACCGGG CGCTCGTGCT GGCCGCGGCG 
GCTGACGGGG TCTCCCGCCT GCGCGGGGCG CTGCGCTCCC GGGACACCGT CCTGATGGCC 
GCCGCCCTGC GCGAGCTCGG CGCGACGGTG ACCGACGAGG CCGCGCCAGG CGGCGCTGAG 
CCGGGCAGGC CGGGTGAGCC GGGCGCGGAC CAGGGCGCCG CCGACATCGT CGTCACCGGC 
CCGGTCGGCG CCGTACGGGG CACGGCCGCG ATCGACTGCG GCAACGCGGG AACGGTCGCG 
CGCTTCACTC CCGCGCTGGC GACACTGGCC CGCGGGGACG TGCGCTTCGA CGGCGATCCC 
CGGATGCGGG ACCGCCCGCT CACCCCGCTG CTGCGCGCGC TGCGCGAGCT GGGCGCCCAC 
ATCGACGGCG ACCGGATGCC CTTCACCGTG CGCGGCACCG GGGCGGTCTC CGGCGGGGCG 
GTGACGGTCG ACGCGTCGGA TTCCAGCCAG CTCGTCTCCG GCCTGCTGCT CGCCGCGGCG 
CGGTTCGAGC GCGGTGCGAC CGTGACCCAC GCCGGTCACC GCCTGCCGTC CGGGCCGTAC 
CTCGACATGA CCGTCGCCGA CCTGCGGGCG GCCGGGGTGG TCGTCGACGT CGACGACCCG 
ACCGCGGACC TGCTGCGCGC CGGGGGCACT CCGGCCGCGT CGACCCGGCG CTGGCGGGTC 
AAGCCCGGCG GGCCGCGGCC GCTGGACCGC GTGATCGAGC CCGACCTCAA CAGCGCCGCC 
CCCTTCGTCG CCGCCGCGGC GGTGACCGGC GGCGAGGTGA CGATCACCGG CTGGCCGGCG 
TCCACCGAGC AGCCCGGCCG GATGCTGCCG GACCTGCTGG TGGCCATGGG CTGCCGGGCG 
GAGCTGGTGC CGGAGGGCCT GCGCGTCACC GGCGGCGGGC GGATCACCGG TATCGACGTC 
GATCTCTCCG ACTTCGGCGA GGCGGCGCCG GTGCTGACCG GGCTGGCCGT GCTGGCGGAC 
TCGCCGTCCC GGCTGCGGGG CATCGCCCAC CTGCGCCTGC AGGAGACCGA CCGGCTCGCC 
GCGCTGGCGA GCGAGCTCGG CCGGCTCGGC GCCCGTGTCA CCGTCACCGA CGACGGCCTG 
TCGATCATCC CGGTGCCGCT GCGCGGCGCC CGGCTCGACC CGCACGCGGA CCACCGGCTG 
GCGATGACCT ACGCCGTGGT CGGCCTGGCG GTGCCCGGGG TCACCGTCGA CGACATCGCC 
ACGACCGGCA AGACGGTCCC CGACTTCGCG CGGATGTGGA CGACGATGCT GGCCGGCTGA

Protein sequence

MQRGQDDPWS APVATGPVRA TVTVPGSKSG TNRALVLAAA ADGVSRLRGA LRSRDTVLMA 
AALRELGATV TDEAAPGGAE PGRPGEPGAD QGAADIVVTG PVGAVRGTAA IDCGNAGTVA 
RFTPALATLA RGDVRFDGDP RMRDRPLTPL LRALRELGAH IDGDRMPFTV RGTGAVSGGA 
VTVDASDSSQ LVSGLLLAAA RFERGATVTH AGHRLPSGPY LDMTVADLRA AGVVVDVDDP 
TADLLRAGGT PAASTRRWRV KPGGPRPLDR VIEPDLNSAA PFVAAAAVTG GEVTITGWPA 
STEQPGRMLP DLLVAMGCRA ELVPEGLRVT GGGRITGIDV DLSDFGEAAP VLTGLAVLAD 
SPSRLRGIAH LRLQETDRLA ALASELGRLG ARVTVTDDGL SIIPVPLRGA RLDPHADHRL 
AMTYAVVGLA VPGVTVDDIA TTGKTVPDFA RMWTTMLAG