Gene Francci3_4496 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_4496
Symbol
ID	3907472
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	5367977
End bp	5369269
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	68%
IMG OID	637881828
Product	nickel-dependent hydrogenase, large subunit
Protein accession	YP_483571
Protein GI	86743171
COG category	[C] Energy production and conversion
COG ID	[COG3259] Coenzyme F420-reducing hydrogenase, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.401222
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGCGA CTAGGACCAT CGCACCTCCC CCACTCACCA GGGTCGAGGG CGAAGGAAGG 
CTGCTAATCA AGATCACCGA CGGGCGGGTG GACGAGGCCC ACCTGAAGAT CTTCGAACCG 
CCGCGCTTCT TTGAGGCGTT CCTCCGCGGC CGGGCCTACA CCGAGCCACC CGACATCACC 
GCCCGGATCT GCGGCATCTG CCCGGTCGCC TACCAGATGA GCGCGCTGGC GGCCATCGAA 
CAAATCTGCG ACGTCACGGT CACCGGCCCA CCCGCCGCCC TACGGCGGCT CATCTACTGC 
GGTGAATGGA TCGAGAGTCA CGCACTACAC GTCTTCCTGC TGCACCTACC GGACTTCCTC 
GGCTACGACA GCGCACTGCA TCTTGCCCAG GACCAGCCCG CCCTGGTCAA GCTGGGACTC 
ACGCTGAAGA AGGCCGGCAA CACGCTCATG ACGGTCATCG GCGGCCGCGC GATCCACCCC 
GTCAACGCGC GGGTCGGCGG CTGGTACCGG GCACCACGCC GGCGTGACCT GACCGAGCTT 
GTCGGGCAAC TGGAACAGGC GCGAGACATC GCCCGGGACA CGGCCCGATT CACCGCCGCC 
CTGGACTTCC CCGAAGACGA ACTCCACCAG ACCTTCGTCG CGCTCCACCA ACCTGGCGAA 
TACCCCGTTG AGCGCGGCCG GATCGCCTCC ACCGCTGGCC TCGACATCGC CCCGGCCGAC 
TACGACCGGC ACTTCACCGA AGAACAGGTG CCCTGGTCGA ACGCCCTGCA CTCGACCCTG 
GCCGCGGGCG GCTCCTACCT CACCGGACCG CTGGCTCGCT TCGCGCTGGG CGCGGAGCGG 
CTGGCGCCCG CCGCCCGCGA GACCGCCGCC GAGATCGGCC TGCGCCCACC GGAGCGCAAC 
CCCTACCGCA GCATCATCGT GCGCTGCATC GAGATGGTCC ACGCCGCCGA CGAGGCGCTG 
CGGATCATCG CGGACTACAC CGAGCCCGAC CCCTCCGCGC TGGAGGCCCC GCCCCGGGCG 
GGAACCGGAT ACGGGGTCAC GGAGGCACCC CGCGGCCTGC TCTACCACCG CTACACGATC 
GACCACAACG GCACCATCCT CGACGCAAAG ATCGTGCCAC CAACCGCCCA GAACCAACGT 
CCGATCGAAG AAGACCTGCG CGGTGTGGTG GAACGCTTCA TGAACCTGTC GGAGCCCGAA 
CTCGCCCTGC GCTGCGAACG GGCCATCCGC AACTACGACC CCTGCATCTC ATGTGCGACC 
CACTTCCTGA CTCTCCACAT CGAACACGGC TGA

Protein sequence

MRATRTIAPP PLTRVEGEGR LLIKITDGRV DEAHLKIFEP PRFFEAFLRG RAYTEPPDIT 
ARICGICPVA YQMSALAAIE QICDVTVTGP PAALRRLIYC GEWIESHALH VFLLHLPDFL 
GYDSALHLAQ DQPALVKLGL TLKKAGNTLM TVIGGRAIHP VNARVGGWYR APRRRDLTEL 
VGQLEQARDI ARDTARFTAA LDFPEDELHQ TFVALHQPGE YPVERGRIAS TAGLDIAPAD 
YDRHFTEEQV PWSNALHSTL AAGGSYLTGP LARFALGAER LAPAARETAA EIGLRPPERN 
PYRSIIVRCI EMVHAADEAL RIIADYTEPD PSALEAPPRA GTGYGVTEAP RGLLYHRYTI 
DHNGTILDAK IVPPTAQNQR PIEEDLRGVV ERFMNLSEPE LALRCERAIR NYDPCISCAT 
HFLTLHIEHG