Gene Clim_0855 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0855
Symbol
ID	6353927
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	937308
End bp	938393
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	53%
IMG OID	642668480
Product	hydrogenase (NiFe) small subunit HydA
Protein accession	YP_001942913
Protein GI	189346384
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA) [TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACAACA ATCAGACCTT CGCCGAAATA TTCAGGGCCA GCGGCATAAG CCGACGGGAT 
TTTTTGAAAT TCTGTTCACT GACCTCAGTC TATCTCGGTC TCTCACCTTC GATTGTACCA 
CAGATCGTTC AGGCTATGGA AACAAAGCCG AGAACTCCGG TTATCTGGCT TCACGGTCTT 
GAATGTACCT GTTGTTCGGA ATCATTCATC CGTTCTTCAC ATCCCACCAT CGAGGATATC 
ATCTTCAACA TGATCTCTCT CGACTATGAT GATGTTCTCA GCGCTGCGGC CGGCCATCAG 
CTTGAGGATG TGCGTAAAAA AATCATGCAG GAGTACAAGG GTAAATACAT TCTTGCCGTT 
GAAGGCAACG CGTCAACGAA GGATGACGGG GTCTATTGCA TGGTGGGAGG CGATTCATTC 
CTGAACACGC TGAAGGAGAC CGCGGCAGAT GCTGCGGCAA TCATCGCCTG GGGGGCTTGT 
GCATCTTACG GATGTGTTCA GAACGCCGAT CCGAACCCTA CCGGTGCAGC GCCTGTTTCG 
GAAATCATCA AGGATAAACC CATCGTCAAC GTTCCGGGGT GTCCACCTAT CTCCGAAGTG 
ATGACCGGGG TTGTGGCACA TTTCCACACC TTCGGCACCC TGCCCGAGCT CGACCGCATG 
GGCAGGCCGA AAGCCTTCTA CAACACCAGG ATTCACGACA AGTGTTATCG GCGCGCATTT 
TACGATGCCG GCATGTTTGT CAGAAGCTTC GACGACGAGG CGACAAGAAA AGGGTGGTGT 
CTCTACAAAA TGGGGTGCAA GGGCCCGACA ACCTATAATT CCTGTTCGAA AATTCAGTGG 
AACGGCGGGG TCAGCTTTCC GATCGGGTCC GGCCATCCGT GCATCGGCTG TTCCGAACCG 
AACTTCTGGG ACAAGGGGCC TTTCTATGAG CGTCTTGCCG ATGTTTCGTT CCTCGGTACG 
GACAGCAATG CCGACAGGAT CGGCGTGATA GCCGTAGGAG CAGCTGCAGC CGGAGCTGCG 
GCACATGCTG CCGTAACGGC AGTCAAAAAG GCCAAGGCAG GAAAGGATTC AGAGGATAAA 
GCTTAA

Protein sequence

MHNNQTFAEI FRASGISRRD FLKFCSLTSV YLGLSPSIVP QIVQAMETKP RTPVIWLHGL 
ECTCCSESFI RSSHPTIEDI IFNMISLDYD DVLSAAAGHQ LEDVRKKIMQ EYKGKYILAV 
EGNASTKDDG VYCMVGGDSF LNTLKETAAD AAAIIAWGAC ASYGCVQNAD PNPTGAAPVS 
EIIKDKPIVN VPGCPPISEV MTGVVAHFHT FGTLPELDRM GRPKAFYNTR IHDKCYRRAF 
YDAGMFVRSF DDEATRKGWC LYKMGCKGPT TYNSCSKIQW NGGVSFPIGS GHPCIGCSEP 
NFWDKGPFYE RLADVSFLGT DSNADRIGVI AVGAAAAGAA AHAAVTAVKK AKAGKDSEDK 
A