Gene Rcas_3148 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3148
Symbol
ID	5540646
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4079875
End bp	4081128
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	63%
IMG OID	640895269
Product	hydrogenase (NiFe) small subunit HydA
Protein accession	YP_001433220
Protein GI	156743091
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA) [TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGCTC GTCCTTTGCC GTTGGAGGAA CGCCTTGCAG CGCGCGGTGT TTCGCGCCGT 
CAATTCCTCA AGTTCTGCGC TGCGATGAGC GCCGCGCTCG CCCTGCCTTC CACCTTTACC 
CCACGTATCG CCAGGGCGCT GAACACTGCC GAACGTCTTC CGGTTGTCTG GTTGGAGTTT 
CAAGATTGCG CCGGCAACAC CGAATCCTTC CTTCGCGCCG AGTCGCCTGG CGTTGCCGAC 
ATTGTGCTGG AGCAGATCAG CCTGGAGTAC CACGAGACGA TCATGGCGCC TGCCGGCCAT 
CGCGCCGAAC ATTCGCTCGA TGCGGTCGTG GAAAACTATC CGGGGCAATA CATCGCCATC 
GTCGAAGGGT CGATCCCCAT TGCCAATGGC GGGGTGTATT GCACGATCGG CGGTCGCACC 
GCGTTGAGCA TCGCAGAGCG TGTGTGCTCG AATGCGCTGG CAACGATTGC GGTTGGCGCA 
TGTGCCTGGG ATGGCGGTTG GCCCGCCGCC AGCCCGAATC CGACCGGTGC GGTTGGTGTG 
CGCCAGGCGG TGCCGGGTCT CAAGAATCTG ATCAACCTGC CGGGCTGCCC GATGAATGTG 
ATTAATCTAA CCGCCGTCAT TGTCCACTAC CTGACATTCA AACAACTGCC GGCAACCGAC 
GAGCAGGGAC GCCCCTTCTT CGCCTATGGG CAGCTCATTC ACAACAACTG TGAGCGTCGG 
GGGCACTTCG ACTCCGGTCG CTTCGTCGAG CGTTGGGGCG ACGAGGGGCA TCGCCTGGGA 
TGGTGCCTGT ATAAGATGGG GTGCAAAGGA CCGCAAACGC TCTCGAACTG TCCTGCGGTC 
GGCTGGAACG GCACGTCCTA CTGGCCCATC GGCGCCGGTC ACGGATGCGT TGGCTGCATG 
TCGCCGCGTT TCTGGGATAC CATGTCGCCT TTCTATGAGC GACTGCCCAA TGTCGAAGGC 
TTTGGCATCG AGGTGACCGC CGATACGCTG GGCGCCATTG CGGTTGGCGC CGTGGCGGCG 
GCCGGTGTAG TCCACGGCGT TGCCAGCGCA ATCCGGGCGA GTCGTCATCC GATTGCGGCG 
CATGGGGGTG AGACGCTGGT GGAAGCCGCA GAGCGCGCCG TTCAGGTGGT AGAGCAGATT 
GCAGGACCGG TCAAAGCGGA GGAAAAGCCG GCAGAAGAGG CAGGGAAGCC GATGGCGTCG 
GGTGACGCCA GGGAGAGCGT TCGTCCCGAT CGGGATGGAC CGTCCGCCTC CTGA

Protein sequence

MPARPLPLEE RLAARGVSRR QFLKFCAAMS AALALPSTFT PRIARALNTA ERLPVVWLEF 
QDCAGNTESF LRAESPGVAD IVLEQISLEY HETIMAPAGH RAEHSLDAVV ENYPGQYIAI 
VEGSIPIANG GVYCTIGGRT ALSIAERVCS NALATIAVGA CAWDGGWPAA SPNPTGAVGV 
RQAVPGLKNL INLPGCPMNV INLTAVIVHY LTFKQLPATD EQGRPFFAYG QLIHNNCERR 
GHFDSGRFVE RWGDEGHRLG WCLYKMGCKG PQTLSNCPAV GWNGTSYWPI GAGHGCVGCM 
SPRFWDTMSP FYERLPNVEG FGIEVTADTL GAIAVGAVAA AGVVHGVASA IRASRHPIAA 
HGGETLVEAA ERAVQVVEQI AGPVKAEEKP AEEAGKPMAS GDARESVRPD RDGPSAS