Gene Lcho_2449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_2449
Symbol
ID	6161642
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	+
Start bp	2657383
End bp	2658438
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	70%
IMG OID	641665219
Product	hydrogenase expression/formation protein HypE
Protein accession	YP_001791479
Protein GI	171059130
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0309] Hydrogenase maturation factor
TIGRFAM ID	[TIGR02124] hydrogenase expression/formation protein HypE

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.027326
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATCA AGAAGGACTA CATCCGCCCG GTCGACTTCA AACATGGCCG CGTCGACATG 
AACCACGGCG CGGGCGGGCG GGCTTCGGCG CAACTGATAG CCGAGTTGTT CGCGCGTGCC 
TTCGACAACG ACTACCTGCG CCAGGGCAAC GACGGTGCGC TGCTCGACAT CCCCGCCGGC 
CACCGGCTGG TGATGGCGAC CGACGCGCAC GTGATCTCGC CGCTGTTCTT TCCGGGCGGC 
GACATCGGCT GCCTGTCGGT GCACGGCACG GTCAACGACG TGGCGATGCT GGGCGCGACG 
CCGCTGTACC TGAGCGCGAG CTTCATCCTC GAAGAAGGCT TCGCGCTGGC CGACCTCAAG 
CGCATCGTCG AGTCGATGGC CGCGGCCTCG CGTGACGCGG GCGTGCCGAT CGTCACCGGC 
GACACCAAGG TGGTCGAACA GGGCAAGGGC GACGGCGTGT TCATCTCCAC CACCGGCATC 
GGCGTGGTGC CGATGGACCG CCAGATCGGC GGCGCGCTGG CGCGGCCGGG CGATGTGGTG 
CTGGTGTCGG GCACGATCGG CGACCACGGC GTGGCGGTGC TGTCGCAACG TGAATCGCTG 
GAGTTCGAGA CCACCATCGA GTCGGACACC GCCGCGCTGC ACGGCCTGGT CGCGCGCCTG 
CTGGCCGCCG TGCCTGAAGG CGCCGTGCAT TGCCTGCGCG ACCCCACGCG CGGCGGCCTA 
GCGACCACGC TCAACGAGAT CACGCGCCAG TCGGGCGTGG GCATGCTGCT GCAGGAGACG 
GCGATTCCCG TCGCGCCGCA GGTCAACGCC GCCTGCGAGC TGCTCGGGCT CGACCCGCTC 
TACATCGCCA ACGAAGGCAA GTGCATCGTG ATCTGCGCGG CCGAACACGC CGACGCGGTG 
CTCGACGCGA TGCGCGCGCA CCCGCTGGGC CGCAACGCGG CGCGCATCGG CAGCGTCACC 
AACGACCCGC ACCACTTCGT GCAGATGGCC ACCGGCTTCG GCGGGCGCCG CATCGTCGAC 
TGGCTCAGCG GCGAGCCGCT GCCGCGCATC TGCTGA

Protein sequence

MSIKKDYIRP VDFKHGRVDM NHGAGGRASA QLIAELFARA FDNDYLRQGN DGALLDIPAG 
HRLVMATDAH VISPLFFPGG DIGCLSVHGT VNDVAMLGAT PLYLSASFIL EEGFALADLK 
RIVESMAAAS RDAGVPIVTG DTKVVEQGKG DGVFISTTGI GVVPMDRQIG GALARPGDVV 
LVSGTIGDHG VAVLSQRESL EFETTIESDT AALHGLVARL LAAVPEGAVH CLRDPTRGGL 
ATTLNEITRQ SGVGMLLQET AIPVAPQVNA ACELLGLDPL YIANEGKCIV ICAAEHADAV 
LDAMRAHPLG RNAARIGSVT NDPHHFVQMA TGFGGRRIVD WLSGEPLPRI C