Gene Francci3_2495 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2495
Symbol
ID	3904873
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2944039
End bp	2945838
Gene Length	1800 bp
Protein Length	599 aa
Translation table	11
GC content	68%
IMG OID	637879825
Product	thiamine pyrophosphate protein
Protein accession	YP_481591
Protein GI	86741191
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0028] Thiamine pyrophosphate-requiring enzymes [acetolactate synthase, pyruvate dehydrogenase (cytochrome), glyoxylate carboligase, phosphonopyruvate decarboxylase]
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.215575
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.718329
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACAGG TCGCGGACTA TGTCCTGCAG CGGTTGACCG GCTGGGGTGT TCACCGCATA 
TTCGGCTATC CCGGGGACGG CATCAACGGC TTCCTCGGGG CTTTCGACCG GGCCGGCGGT 
GATCCTGGGT TCCTGCAGAC CCGGCACGAG GAGATGGCGG CGTTCATGGC CTGCGCGCAC 
GCCAAGTTCA CCGGTGAGGT AGGCGCGTGT GTCGCGACCT CCGGCCCGGG GGCGATCCAT 
CTGCTCAACG GTCTCTACGA CGCCCGGCTC GACCATCAGC CGGTGCTGGC GATCGTCGGC 
CAGCAGCGGC GGACCTCCCT CGGCGCCCAC TACCAGCAGG AAATCGATCT GATCTCGCTG 
TTCAAGGACG TCACCGAGTA CGTGCAGTAC TGCATGGCCC CGCCCAGCGC CCGTCATCTC 
GTCGATCGGG CGATGAAGAC AGCGCTGTCC AGCCGGGCGC CGGTCTGCCT GATCTTCCCG 
GAGGATGTCC AGGAGGAGAA GTACACCGAG CCTCCGCATG AGCACGGGGC GGTGCGGACC 
AGCATTGGCT GGACGAAACC ACGCATCCTG CCGGATCCGG ACGAGGTGCG CCGCGCCGCC 
GCCGTGCTGA ATCGGGGCCG CCGGGTGGCG ATGTTGATCG GGCAAGGGGC GGCCGGCGCC 
CGCGAGGAGG TGACGGAGGC CGCCGACCTG CTCGGCGCGG GTGTCGCCAA GGCCCTGCTC 
GGCAAGGATG CGCTCCCCGA TACCCTGCCG TTCGTGACCG GCCCCATCGG GCTGCTCGGC 
AGCGAAGCCA GCCACAAGAT GGTGATGGGC GCCGACACGC TCCTCCTGGT CGGGACGAGC 
TTCCCCTACT CGGAGTGGCT GCCGCGGGAG GGCCAGGCCG CCGGCGTCCA GATCGATATC 
GACGGCCGGA TGATCGGTAT TCGTTATCCG ATGGATGTTC ATCTCGTCGG CGACGCGGCC 
GAGACGCTGC GCCAGTTGAT TCCCCTGCTC ATCCGCAAGG AGGACCGTTC CTGGCGGCGG 
TTCATCGAAC GGGAGGTGGC GACCTGGCAG CGGGTGCTGG CGGACCGGGC CAGGCTGCGG 
GCGGATCCGA TGAACCCGCA GATCGTCGCG TACGAGTTGG ACAAGCGACT GCCCGATAAC 
GCGATCCTCA CCGCGGACTC CGGGTCGGCG ACCACCTGGT GGGCCCGTTA CCTGCGCATC 
CGTGGGGACA TGAAGGCGTC GTTGTCGGGA ACCCTGGCGA CCATGCTGCC CGGAGTGCCC 
TACGCGGTGG CGGCGAAGCT GGCCTATCCG GAACGACCGG TGATCGCGTT CGTCGGCGAC 
GGGGCGTTCT CGATGCTGGG CATGAACGAG CTGTTCACGG TCAAGCGGTA CTGGGAGAGG 
ATGAACACCG ATCCGCGGCT GGTGTTCACC GTGTTCGTGA ACGAGGACCT CAACCAGGTC 
TCCTACGAGC AGCGGGTGAT GGCGGGTGAT CGGATCAATG TCGAGACGCA GAAGATCCCG 
TATGTGCCGG CGGCGGATTT CGCCCGGCTC CTCGGTTTCA CCGGGATCCG CTGCGACTCG 
CCGGACAAGA TCGGTGCCGC GTGGGAACAG GCGCTGGCTG CGGACCGGCC GGTTGTGCTT 
GAGGTCGTTG TCGACGCGAA GGTGCCGCCG CTGCCGCCGC ACGTCCGGCC CGAGCAGATG 
CGCAAGACCG CCCGGGCGTT CCTGCAGGGC GACCCAGAGG CCGTCGGCAT CGCCGTGCAG 
GGCTTCAAGG GCAAGTGGCA GGAGGCGAGG GAGCACCTCC CGCACGCCGC CCGCAGGTAG

Protein sequence

MSQVADYVLQ RLTGWGVHRI FGYPGDGING FLGAFDRAGG DPGFLQTRHE EMAAFMACAH 
AKFTGEVGAC VATSGPGAIH LLNGLYDARL DHQPVLAIVG QQRRTSLGAH YQQEIDLISL 
FKDVTEYVQY CMAPPSARHL VDRAMKTALS SRAPVCLIFP EDVQEEKYTE PPHEHGAVRT 
SIGWTKPRIL PDPDEVRRAA AVLNRGRRVA MLIGQGAAGA REEVTEAADL LGAGVAKALL 
GKDALPDTLP FVTGPIGLLG SEASHKMVMG ADTLLLVGTS FPYSEWLPRE GQAAGVQIDI 
DGRMIGIRYP MDVHLVGDAA ETLRQLIPLL IRKEDRSWRR FIEREVATWQ RVLADRARLR 
ADPMNPQIVA YELDKRLPDN AILTADSGSA TTWWARYLRI RGDMKASLSG TLATMLPGVP 
YAVAAKLAYP ERPVIAFVGD GAFSMLGMNE LFTVKRYWER MNTDPRLVFT VFVNEDLNQV 
SYEQRVMAGD RINVETQKIP YVPAADFARL LGFTGIRCDS PDKIGAAWEQ ALAADRPVVL 
EVVVDAKVPP LPPHVRPEQM RKTARAFLQG DPEAVGIAVQ GFKGKWQEAR EHLPHAARR