Gene Francci3_2488 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2488
Symbol
ID	3904866
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2934426
End bp	2935592
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	72%
IMG OID	637879818
Product	pyruvate dehydrogenase
Protein accession	YP_481584
Protein GI	86741184
COG category	[C] Energy production and conversion
COG ID	[COG1071] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, alpha subunit
TIGRFAM ID	[TIGR03181] pyruvate dehydrogenase E1 component, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.915026
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.661007
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAATCC TCGACGACAG CACCGCGCCC GGCTTCGTCG GGCCGCCGAG CTCCCACGGT 
CCGCGTCGTG ACCCGGCTCC GCTCCTGCCC GACCCCGAGC CGGTCCGGGT CCTCGGCACG 
GAGGCGGCGG GGAAGGTCGA CACCGATCTG CTGCGCGTCC TGTACCACCG TCTGGTGCTG 
GGACGGCGCT TCAACCAGCA GGCCACGACC CTGGCCAGGC AGGGCCGCCT CGCCGTGTAC 
CCGGCGTCCA CCGGCCAGGA GGCATGCCAG ATCGCCGCGG CCATGGTGCT GCGGGAGTCG 
GACTGGCTGT TCCCCAGCTA CCGCGACACG CTGGCGGTGG TGTCGAGGGG CGTGCGCCCG 
GTGGACGCGC TGACGCTGAT GCGCGGGAAC GCGCACAGCG GCTACGATCC GCGGGAGCAC 
CGGATCGCGC CGCTGTCGAC TCCGCTGGCC ACCCAGGCCT GCCATGCGGT GGGCCTGGCC 
CACGCCGCTC GCCTGCGCGC GGCCTCGGAT CCGTGGGCGG CGGAGGACGT CGTGGCGCTT 
GCCCTGATCG GCGACGGCGG CACCAGCGAG GGCGACTTCC ACGAGGCGCT GAACTTCGCC 
GGGGTGCTGA ACGCGCCAGT GGTGTTCCTG GTACAGAACA ACGGCTATGC GATTTCGGTG 
CCGCTGGCCC AGCAGTCCGC GGCGCCGACG CTGGCACACA AGGCGGTGGG CCATGGGATC 
ATCGGTCGTT TGGTGGACGG CAACGACGCG CCCGCGGTGC ACGGTGTGCT GCGCGCGGCG 
GTCGAGCACG CGCGGTCGGG TCGCGGCCCG GTGCTGGTCG AGGCGGTCAC CTACCGGCTG 
GAGGCGCACA CCAACGCCGA CGACGCGACC CGCTACCGCA CCTCGGAGGA GGTCGCCGCC 
TGGCAGGCCC GCGATCCGCT GACGCTGCTG GAGCGGCAGC TACGCAAGGC CGGTCTCCTC 
GACGACGCCG GCGTCGCCGC AGTCGCGCGG GCCGCCGAGG AACTCGCCGC CGAGATGCGC 
GCCCAGTTCG ATCGTGTGCC TGATCTCGAT CCGGGCTCAC TGTTCACGCA CGTCTATGCC 
CAGCCGACCA GCCAGCTTCG TGAGCAGGCC GCCGAGCTGA TGGCCTGGCA GGCCGCGGAC 
GCAGCCAAGA GCGACGACGC ACGATGA

Protein sequence

MTILDDSTAP GFVGPPSSHG PRRDPAPLLP DPEPVRVLGT EAAGKVDTDL LRVLYHRLVL 
GRRFNQQATT LARQGRLAVY PASTGQEACQ IAAAMVLRES DWLFPSYRDT LAVVSRGVRP 
VDALTLMRGN AHSGYDPREH RIAPLSTPLA TQACHAVGLA HAARLRAASD PWAAEDVVAL 
ALIGDGGTSE GDFHEALNFA GVLNAPVVFL VQNNGYAISV PLAQQSAAPT LAHKAVGHGI 
IGRLVDGNDA PAVHGVLRAA VEHARSGRGP VLVEAVTYRL EAHTNADDAT RYRTSEEVAA 
WQARDPLTLL ERQLRKAGLL DDAGVAAVAR AAEELAAEMR AQFDRVPDLD PGSLFTHVYA 
QPTSQLREQA AELMAWQAAD AAKSDDAR