Gene Franean1_3316 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3316
Symbol
ID	5671688
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3928344
End bp	3929342
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	72%
IMG OID	641242205
Product	pyruvate dehydrogenase (acetyl-transferring)
Protein accession	YP_001507625
Protein GI	158315117
COG category	[C] Energy production and conversion
COG ID	[COG1071] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.395155
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGACGG AGCAGGCGGC GGAGCCGGCG CTCGATGTGC GGCGTCGGCT GTACGAGCTG 
ATGACGCTCA TGAAGGCGGC CGACGATCGG CTGAGCAAGG GGATCGCCTC GGGCGAGCTG 
CAGTGCGTGT ACTGGCCCTC ACGTGGTCAG GAGGCGATCG CCGCGGCGGT GGGCGTGGTC 
CTCCGCCTGG ACGATCAGCT GGTCACGACG TACCGCGGAC TGCACGACCT GATCGGCAAG 
GGCGTGCCGC TGGTCGAGAT CTACGGCGAG ATGCTGGGCC GCCAGGTCGG CTCCGGCCGC 
GGCAAGGGCG GGACGATGCA CATCGCGCAT CCCGACTCCG GCCTCATGAT GTCGACGGGG 
ATCGTGGGCG CGGGGCCCCC GGTCGCGGTC GGGCTGGCCA TGGCCGCACG GCGCAAGGGC 
CTCGACCGGG TGACGGTCGC CAGCTTCGGT GACGGGGCCA CGAACACCGG CTCCTTCCAC 
GAGGCGGCGA ACATGGCGGC GCTGTGGGAC CTGCCGCTGG TGCTGGTCTG CCAGAACAAC 
CAGTACGCCG AGATGACGCC GACCGGGCAC ACGATGAAGA TCGCCCAGGT CGCGGACCGG 
GCGGCCGGCT ACGGGATGCC GGGCGTCCGC GTCGACGGCA ACGACCCCCT CGCCGTCGTC 
GCCGCGCTGG AGGAGGCCGT CGAGCGGGCG AGAGCCGGCG CCGGCCCAAC GCTCCTGGAA 
TGCGTGACGT TCCGGTTCCG CGGCCACTAC TTCGGCGATC CGATGAAGTA CATCCCGACG 
GAGCAGATGG ACGCCGCGAT CGCGGCTGAT CCCCTCCCGC GTTTCCGGTC ACGTCTGTTG 
GACGACGGGA TCTGCGGTGC GCGGGAGCTC GACGAGATCG AGACGGCCGC CGTCTCGGCG 
GTTGACGAGG CGCTGGCCGC CGTCCTGGCC GCGCCCGCCG CGGCACTCGA CGAGCTGGAC 
CGGGACGTGT ACGCCGATCC GCGCAACTGC CCCGCGTAG

Protein sequence

MTTEQAAEPA LDVRRRLYEL MTLMKAADDR LSKGIASGEL QCVYWPSRGQ EAIAAAVGVV 
LRLDDQLVTT YRGLHDLIGK GVPLVEIYGE MLGRQVGSGR GKGGTMHIAH PDSGLMMSTG 
IVGAGPPVAV GLAMAARRKG LDRVTVASFG DGATNTGSFH EAANMAALWD LPLVLVCQNN 
QYAEMTPTGH TMKIAQVADR AAGYGMPGVR VDGNDPLAVV AALEEAVERA RAGAGPTLLE 
CVTFRFRGHY FGDPMKYIPT EQMDAAIAAD PLPRFRSRLL DDGICGAREL DEIETAAVSA 
VDEALAAVLA APAAALDELD RDVYADPRNC PA