Gene Franean1_1093 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1093
Symbol
ID	5669507
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1304976
End bp	1306565
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	72%
IMG OID	641240025
Product	D-3-phosphoglycerate dehydrogenase
Protein accession	YP_001505455
Protein GI	158312947
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0111] Phosphoglycerate dehydrogenase and related dehydrogenases
TIGRFAM ID	[TIGR01327] D-3-phosphoglycerate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCGTCG TACTCGTCGC CGAGGAACTC TCACCGGCCG GGCTGGAGGT CCTGTCCGGG 
GACTTCGAGA TCCGCCATGT GGACGGGGCC GACCGGTCCG CCCTGCTGCC GGCGCTGGCG 
GACGTCGACG CGGTCCTCAT CCGCTCGGCG ACGAAGATCG ACGCCGAGGC GCTCGCGGCC 
GCCCCGCGGC TGAAGGTCGT GGCCCGCGCC GGGATCGGGC TCGACAACGT CGACGTCCCC 
GCCGCCACCA ACCGCGGCGT CATGGTGGTG AACGCGCCGC AGTCGAACAT CGTCAGTGCC 
GCCGAGCACG CCATCGCACT GCTGCTCGCG GTCGCCCGCC GGGTCCCGGC CGCCCATGAG 
TCGCTCGTCG GCGGTGAGTG GAAGCGCTCG AAGTACGTCG GCGTGGAGCT GACGGAGAAG 
ACCGCGGGCG TCGTCGGCCT CGGCCGCATC GGTGTCCTGG TCGCGCAGCG GCTGGCGGCC 
TTCGGCATGA AGGTCCTGGC CTACGACCCC TATGTCTCCG TCGCCCGCGC CTCGCAGCTC 
GGTGTGCGCC TGGTGGACCT CGACGAGCTG CTCACGTCCA GCGACGTCAT CACGATCCAC 
CTGCCGAAGA CACCCGAGAC GCTGGGGCTC ATCGGGGCCG ACGAGCTGGC CCGGGTGAAG 
CCGGGCGTGA TCATCGTCAA CGCGGCGCGC GGCGGCCTGG TCGACGAGGG CGCCCTGGCC 
GACGCGGTCC GGTCCGGCCG GGTCGGCGGT GTCGGGCTCG ACGTGTACGT CAAGGAGCCG 
ACCACCTCCT CGCCGCTGTT CGGGCTGGAG AACGTCGTCG TCACCCCGCA CCTGGGCGCC 
TCGACGCAGG AGGCGCAGGA CAAGGCCGGT CTGGCCGTGG CCCGTTCGGT GCGCCTCGCG 
CTCAGCGGCG AGTTCGTCCC GGACGCGGTG AACGTGCAGG CCGGCGGGGT CGTGGCCGAG 
GACGTGCGGC CCGGTCTGCC GCTGGCGGAG AAGCTGGGCC AGCTCTTCTC CGGGCTGGCC 
GCGGGCGTGG CCGCCGCGAT CACCGTCGAG GTGCGCGGCG AGATCGCCGC GCACGACGTG 
TCGGTGCTGC AGCTCGCCGT CCTCAAGGGT GTCTTCATCG ACATCGTCGA GGAGCAGGTC 
ACCTACGTGA ACGCGCCGCT GATCGCCAAG GAGCGCGGCG TCGACGTGGC GCTGGAGACC 
TCCGAGGAGA GCCCCGACTA CCGCAACCTC GTCACGGTGC GCGGTGTCCT GCCCGACGGG 
ACGGCGGTGT CGGTCAGCGG GACGCTCGTC GGCTCCCGCC AGGTCGAGAA GATCACCGCG 
ATCGACGGGT TCGAGGTCGA CCTGCGTCCC GAGGACCACC TGGCGTTCTT CCGTTACGAG 
GATCGTCCCG GCATCGTCGG GGCCGTCGGC GCGCTGCTGG GCGAGGCCCA CATCAACATC 
GCCAACGCTC AGGTCAGCCG GCTCAGCGCC GGTGGCGAGG CCCTCATGTC GCTGTCCCTG 
GACGACGCGG TGGCGCCCGA CATCCTGGCC GAGATCGCCA AGATCATCGG TGCGTCGTAC 
GCCCGCGCGG TGAGCATCTC CGCGGGCTGA

Protein sequence

MPVVLVAEEL SPAGLEVLSG DFEIRHVDGA DRSALLPALA DVDAVLIRSA TKIDAEALAA 
APRLKVVARA GIGLDNVDVP AATNRGVMVV NAPQSNIVSA AEHAIALLLA VARRVPAAHE 
SLVGGEWKRS KYVGVELTEK TAGVVGLGRI GVLVAQRLAA FGMKVLAYDP YVSVARASQL 
GVRLVDLDEL LTSSDVITIH LPKTPETLGL IGADELARVK PGVIIVNAAR GGLVDEGALA 
DAVRSGRVGG VGLDVYVKEP TTSSPLFGLE NVVVTPHLGA STQEAQDKAG LAVARSVRLA 
LSGEFVPDAV NVQAGGVVAE DVRPGLPLAE KLGQLFSGLA AGVAAAITVE VRGEIAAHDV 
SVLQLAVLKG VFIDIVEEQV TYVNAPLIAK ERGVDVALET SEESPDYRNL VTVRGVLPDG 
TAVSVSGTLV GSRQVEKITA IDGFEVDLRP EDHLAFFRYE DRPGIVGAVG ALLGEAHINI 
ANAQVSRLSA GGEALMSLSL DDAVAPDILA EIAKIIGASY ARAVSISAG