Gene Cagg_0479 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0479
Symbol
ID	7266647
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	588650
End bp	589765
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	58%
IMG OID	643565342
Product	hydrogenase expression/formation protein HypD
Protein accession	YP_002461856
Protein GI	219847423
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0409] Hydrogenase maturation factor
TIGRFAM ID	[TIGR00075] hydrogenase expression/formation protein HypD

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0595509
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.140537
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATATC TTGACGAATT TCGTGACCCA GCGCTGGCCC GCCGCCTCTT CGAGCAAATC 
CGACGCATCA CCACACGTCA CTGGGCAATT ATGGAAGTCT GCGGCGGCCA GACCCATTCG 
ATCATTCGCA ACGGAATCGA TCAGTTACTG CCACCCGAGA TCGAGCTTAT CCACGGCCCC 
GGCTGCCCAG TCTGCGTTAC TCCACTCGAA ATCATCGACA AGGCGCTGGC CATTGCCGCC 
CTCCCCGAAG TGATCTTCTG CTCATTTGGC GACATGCTGC GCGTGCCAGG TAGCCGCAAA 
GACCTCTTCC GCGTCAAGAG CGAAGGTGGT GACGTGCGCG TCGTCTATTC CCCGCTCGAC 
GCAGTAAAGC TGGCCCAACA ACACCCCGAC CGCCAAGTCG TCTTTTTTGC CATCGGCTTC 
GAGACTACTG CACCCGCCAA CGCCATGGCG GTCTATCAGG CAGCCAGACT CGGCCTCAAG 
AACTTTTCGA TGTTGGTCTC ACACGTCCTG GTACCACCGG CAATCAGTGC GATTATGGAG 
TCGCCGAACA ACCGCGTCCA AGGCTTTCTA GCCGCTGGTC ATGTCTGCAG CGTCATGGGC 
ATCGAAGAAT ATCGCTCGCT CGTCGAAACA TATCGTGTCC CCATTGTGGT TACCGGTTTT 
GAGCCACTCG ACGTACTCGA AGGCATTCGT CGCGCCATTC TCCAACTCGA GCAAGGCCGT 
GCCGAACTAG ACAACGCCTA CGAACGCGCC GTTCGCCCGG AAGGCAACGT CGCCGCCAAA 
CAAATGCTTG CCGATGTCTT CACCGTCACC GACCGCACTT GGCGTGGAAT TGGGCGCATC 
CCGCGCAGCG GTTGGCGGCT CAGTGACCGC TACGCCGAAT TCGATGCCGA ATTCCGATTC 
AACGTCCACG ACATCCAAAC GAGCGAGTCG CCGCTATGTC GGAGTGGTGA AGTGCTGCAA 
GGATTGCTCA AACCAAACCA ATGCCCGGCC TTCGGTAAAG AATGCACACC GCGGACGCCA 
CTTGGCGCAA CGATGGTATC AAGCGAGGGA GCATGCGCAG CGTATTATCA GTATGGCCGA 
TTCGTGCCAA CCAGCACGAT TGGTGTAGCA TCGTAA

Protein sequence

MKYLDEFRDP ALARRLFEQI RRITTRHWAI MEVCGGQTHS IIRNGIDQLL PPEIELIHGP 
GCPVCVTPLE IIDKALAIAA LPEVIFCSFG DMLRVPGSRK DLFRVKSEGG DVRVVYSPLD 
AVKLAQQHPD RQVVFFAIGF ETTAPANAMA VYQAARLGLK NFSMLVSHVL VPPAISAIME 
SPNNRVQGFL AAGHVCSVMG IEEYRSLVET YRVPIVVTGF EPLDVLEGIR RAILQLEQGR 
AELDNAYERA VRPEGNVAAK QMLADVFTVT DRTWRGIGRI PRSGWRLSDR YAEFDAEFRF 
NVHDIQTSES PLCRSGEVLQ GLLKPNQCPA FGKECTPRTP LGATMVSSEG ACAAYYQYGR 
FVPTSTIGVA S