Gene Francci3_1070 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1070
Symbol
ID	3906413
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1274289
End bp	1275395
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	71%
IMG OID	637878404
Product	hydrogenase expression/formation protein HypD
Protein accession	YP_480181
Protein GI	86739781
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0409] Hydrogenase maturation factor
TIGRFAM ID	[TIGR00075] hydrogenase expression/formation protein HypD

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.250969
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGGTACC TGGCGGAGTT CCGCGACCCG GCGTTGGCCC GCCGGCTGCT GGATGCGATC 
ATCGCCACCG CGACCCGGCG CTGGGCGATC ATGGAGGTCT GCGGCGGCCA GACCCACTCG 
ATCATCCGCA ACGGAATCGA TCAGCTCCTC ACGGACCAGG TCGAGTTCAT CCACGGCCCC 
GGCTGCCCAG TGTGCGTCAC GCCGCTGGAG ACGATCGACC GGGCGCTGGC GATCGCCGCC 
CGCCCCGAGG TGATCTTCTG CTCGTTCGGG GACATGCTGC GGGTCCCCGG CAGCGGCATG 
GACCTGTTCA TGGTCCGGGC GCGTGGCGGG GACGTCCGGG TGGTCTACTC GCCGCTCGAC 
GCGGTCCGCC TCGCCGAGGA GAACCCGGAC CGCCAGGTCG TGTTCTTCGG AGTGGGCTTC 
GAGACCACCG CCCCAGCCAA CGCGATGGCC GTGGTGACGG CCCGGCGCCG TGGAATCGAC 
AACTTCTCCG TACTTGTCAG CCACGTGCTG GTGCCGCCGG CGATGACCGC GGTCCTCTCC 
TCGCCGGCGA ACCGGGTGGC GGCGTTCCTG GCAGCCGGCC ACGTGTGCAC GGTGATGGGC 
ACCTTCCAGT ACGAGCCATT GGTGGCGACC TACCGGGTAC CGATCGTCGT CACCGGTTTC 
GAGCCGCTCG ACCTGCTCGA CGGGGTGCGC CACGCCGTCG AGCAGCTCGA GGCGGGGCGG 
GCAGAACTCG CGAACGCCTA CCCGCGGGCG GTGCGGCCGG CGGGCAACCC GGCGGCCCGG 
GAAATCCTCG CCGAGGTTTT CACGGTGTGT GACCGGGCCT GGCGGGGAAT CGGGACAATC 
CCGGACTCGG GTTGGCGGCT GTCCGCGGCG TACCGGGACT TCGACGCCGA GGTCCGCTTC 
GACGTCGAGG GCCTCACGGT GGCCGAACCG GCCGAATGCC GCAGCGGCGA GGTGTTGCAG 
GGCCTGGTCA AACCGCCGCA GTGCCCGGCG TTCGGAACCT CCTGCACGCC ACGCACCCCG 
CTCGGCGCGA CGATGGTCTC GGCGGAGGGG GCATGCGCCG CCTACTTCCA GTTCCGGCGA 
CTGACTCCGG CGGGCAGCCG TGGCTGA

Protein sequence

MRYLAEFRDP ALARRLLDAI IATATRRWAI MEVCGGQTHS IIRNGIDQLL TDQVEFIHGP 
GCPVCVTPLE TIDRALAIAA RPEVIFCSFG DMLRVPGSGM DLFMVRARGG DVRVVYSPLD 
AVRLAEENPD RQVVFFGVGF ETTAPANAMA VVTARRRGID NFSVLVSHVL VPPAMTAVLS 
SPANRVAAFL AAGHVCTVMG TFQYEPLVAT YRVPIVVTGF EPLDLLDGVR HAVEQLEAGR 
AELANAYPRA VRPAGNPAAR EILAEVFTVC DRAWRGIGTI PDSGWRLSAA YRDFDAEVRF 
DVEGLTVAEP AECRSGEVLQ GLVKPPQCPA FGTSCTPRTP LGATMVSAEG ACAAYFQFRR 
LTPAGSRG