Gene Franean1_4106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4106
Symbol
ID	5672464
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4890914
End bp	4891945
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	74%
IMG OID	641242982
Product	D-isomer specific 2-hydroxyacid dehydrogenase NAD-binding
Protein accession	YP_001508399
Protein GI	158315891
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0111] Phosphoglycerate dehydrogenase and related dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCTCA CCTCACTACC AGGAGCCGCA CCGCTACCCG GCGCCGCACC AACACCCGCA 
GTCCCGACTC CCACCCCGCC CACCACCGCC ACGGTGATCG CGGCCGTGGT CCCGAGCCCG 
GCCGTCGAGC TGATCCGGTC CCGGCTCGGC GCCGAGGCGC ACGTCGTCGA CGTTCTCGGC 
GGGGAGGTCG TGCCGGCGTC GTCGGGCCCG GTGACAGTCC TGGTGATGCC CTCGGCGCTG 
CGCGGCTCGC CGCCGGCCGG CGTGCTGGCG GCGCTCGAGC GGGCCGGCTG GGTGCACTTC 
CTGTCGACAG GGGTCGACGG CTTCCCGCTC GACCGCCTCG CCGGCCGCGC GGTGACCTGC 
GGCCGCGGGG CGAACAGTCC GGCGATCGCC GAGCTCACCG TCAGCCTGCT GCTCGCCGCC 
GAGAAGCGGA TCCCGCAGAT CTGGGAGGCC GAGACGAACG AGCCGTTCCT CACCGAGCCG 
TTGGGCACTC TCGTCGGTCG GACGGTAGGG CTGATCGGAT TCGGGTCCAT CGGTCAGGAG 
CTGGCTCGCC GGCTGGACGG GTTCGGGACC CGGTTGCTGG CCCTGCGCCG CAGCGGACGC 
CCGGCCGAAC AGCCGACCGT GACCGTGGTG CGGACCCTGC CCGAGCTGGT CGGCGAGACG 
GACCACCTCG TCGTGGCCGC GCCACTGACC CCGGAGACGG ACCGGCTGCT GGACGACGCG 
GCGTTCGTCG TCACCAAGCC CGGTCTGCAC CTGGTCAACG TCGCCCGGGG GCGGATCGTC 
GACACCGACG CGCTGGTCCG GGCGCTGGCC GCCGGGACGG TGTCCCGCGC CAGTCTGGAC 
GTCACGGACC CCGAACCGCT GCCGGCCGGC CATCCGCTGC GCCATGACGC CCGCGTCCGG 
ATCCTGCCGC ACCTGTCCTG GTCGGCTCCC GGCGGCCTCA GCCGCGGCTT CGACCTCTTC 
GCAGACAACC TGCAACGCTG GCGCGCGGGC CGGCCGCTGC ATGGCGTCGT CGACGTCGAG 
GCCGGCTACT GA

Protein sequence

MSLTSLPGAA PLPGAAPTPA VPTPTPPTTA TVIAAVVPSP AVELIRSRLG AEAHVVDVLG 
GEVVPASSGP VTVLVMPSAL RGSPPAGVLA ALERAGWVHF LSTGVDGFPL DRLAGRAVTC 
GRGANSPAIA ELTVSLLLAA EKRIPQIWEA ETNEPFLTEP LGTLVGRTVG LIGFGSIGQE 
LARRLDGFGT RLLALRRSGR PAEQPTVTVV RTLPELVGET DHLVVAAPLT PETDRLLDDA 
AFVVTKPGLH LVNVARGRIV DTDALVRALA AGTVSRASLD VTDPEPLPAG HPLRHDARVR 
ILPHLSWSAP GGLSRGFDLF ADNLQRWRAG RPLHGVVDVE AGY