Gene Francci3_1069 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1069
Symbol
ID	3906412
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1273235
End bp	1274296
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	76%
IMG OID	637878403
Product	hydrogenase expression/formation protein HypE
Protein accession	YP_480180
Protein GI	86739780
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0309] Hydrogenase maturation factor
TIGRFAM ID	[TIGR02124] hydrogenase expression/formation protein HypE

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.582687
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCTGACC CCGTCGACCC GACCGGTTGG ACCTGCCCAC TTCCGCTGCG TGACCATCAC 
CAGGTGGTAC TGGGGCACGG CGGCGGCGGC GTGCTGTCGA GCGAGCTGAT CGAGCATCTG 
TTCCTGCCCG CGTTCGGGAC CACCGACACG GCGCGGGCAC CGGCGGACTC GGCGGTCCTG 
GATGTCGCGG GCGCCCGGCT CGCGTTCTCC ACCGACTCGT ACGTGGTGCG CCCGCTGTTC 
TTCCCCGGTG GCTCCATCGG CGAGCTCGCG GTCCACGGCA CCATCAACGA CCTGGCCTGT 
GCCGGCGCGG TGCCGGTGGC GCTCTCGGCC GGGTTCATCC TCGAGGAGGG CCTGGAGCTC 
GCGGTCCTGG GCCGGGTGGC GCAGGCGATG GGCCGGGCCG CCGCCGCGGC GGGGGTGCGG 
CTGGCGACCG GGGACACCAA GGTCGTCGAG CGCGGGCTGG CCGACGGTCT GTACGTGAAC 
ACCAGCGGCA TCGGGCTCGT CCCGGCCGAG GTGGACATCC GCCCCGAACG GGCGAGACCC 
GGCGACCGGG TCATCGTCTC CGGTCCCGTC GGCGAGCACG GTGTCGCCGT GCTGAGCGTG 
CGCGACGGGC TGGAGTTCGG CGGCGAGGTC CGCTCCGACA CGACGGCGCT GCACGGGCTG 
GTCGCGGCGG TGCTGGCGGC CGCCCCGGGG GTCCACGCGC TGCGCGACCC GACCCGAGGT 
GGCCTCGCGA CCGCGCTGTG CGAGATCGCC GCCGCGTCCG GGACGGGCAT CGAGTTCGCC 
GAGCGCGCCG TGCCGGTGCC GCCCGCGGTC GAGGCGGCCT GCGGGTTCCT CGGCCTCGAC 
CCGCTGCACG TGGCGAACGA GGGCAAGCTG GTCGCGTTCG TCGCCGACGC CGACGCCGAC 
GCGGCGCTCG CGGCGATGCG GGCGCATCCG GCGGGGCGTG ACGCGGCCGT CATCGGCACG 
GTCACCGCGG AGCATCCGGG CGTGGTTGTC GGGCGCACCG CGTTCGGGGG AACCCGCATC 
GTCGACCGGC CGCTCGGCGA GCAGCTCCCC CGCATCTGCT GA

Protein sequence

MADPVDPTGW TCPLPLRDHH QVVLGHGGGG VLSSELIEHL FLPAFGTTDT ARAPADSAVL 
DVAGARLAFS TDSYVVRPLF FPGGSIGELA VHGTINDLAC AGAVPVALSA GFILEEGLEL 
AVLGRVAQAM GRAAAAAGVR LATGDTKVVE RGLADGLYVN TSGIGLVPAE VDIRPERARP 
GDRVIVSGPV GEHGVAVLSV RDGLEFGGEV RSDTTALHGL VAAVLAAAPG VHALRDPTRG 
GLATALCEIA AASGTGIEFA ERAVPVPPAV EAACGFLGLD PLHVANEGKL VAFVADADAD 
AALAAMRAHP AGRDAAVIGT VTAEHPGVVV GRTAFGGTRI VDRPLGEQLP RIC