Gene Rcas_3147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3147
Symbol
ID	5540645
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4078132
End bp	4079844
Gene Length	1713 bp
Protein Length	570 aa
Translation table	11
GC content	60%
IMG OID	640895268
Product	nickel-dependent hydrogenase large subunit
Protein accession	YP_001433219
Protein GI	156743090
COG category	[C] Energy production and conversion
COG ID	[COG0374] Ni,Fe-hydrogenase I large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAAAA TTGCTATTGA TCCGATCACC CGCATTGAAG GACATCTGCG TATCGAGGCG 
CAGATCGAGC GCGGGCGCGT AGTGGATGCC TGGAGCAGTT CGACGATGTT CCGCGGCATG 
GAGATCGTCC TGCGCGGACG CGATCCGCGC GACGCCTGGG TGTTTGCGCA GCGCATCTGC 
GGCGTCTGCA CGACCGTCCA TGCGCTTGCA TCGGTGCGCG CCGTTGAAAA CGCGCTCGAT 
ATTCAGATAC CCGACAATGC CCGGCTTATC CGCAACATCA TCGCAGGCGC CCAATATGTG 
CAAGACCATG TCATCCACTT CTACCACCTG CACGCCTTAG ACTGGGTAGA TATCGTGAGT 
GCGCTCAAGG CCGATCCGGT CAAAACATCG GAACTGGCGC AGAGCATTTC CGACTGGCCC 
AAATCGTCGC CCGCCTACTT CAAGGGTGTC CAGGACCGAT TGCAAAAGTT CGTTGACAGC 
GGGCAATTGG GGATTTTTGG CAACGCCTAT TGGGGGCATC CGGCGTATGC GCTGCCGCCT 
GAAGCCAATC TGATGGCCGT GGCGCACTAC CTGGAAGCGC TGGAGTGGCA GAAGGACGTC 
ATCAGAATTC ACGCGATTCT GGGCGGTAAG AATCCCCACC CGCAGACATA TCTCGTCGGC 
GGGATGGCAG CGCCGCTCGA CCCGAATGCG CAGCAGGCGA TCAACACCAT CCGCATCGCG 
CAGTTGAAAA TGCTCGCCGA TCAGGTGCGC ACGTTTGTGG GCAAGGTCTA CATTCCCGAT 
ATTCTGGCTA TCGCATCATT CTACAAAGAC TGGGCAGGGC TTGGCGCTGG CGTGGGCAAC 
TATCTGTCGT ATGGCGACTT CCCGGCTGCG AAAGATGGCA ACGTCGCCAG TTACTGGCTG 
CCGCGCGGTG TGATTGTGAA CAAGAATATC GACCAGAAGC CGCAACCGGT GAACCACGAG 
CGCGTGACCG AATATGTTGC GCATTCCTGG TTCCGCTATG GCGAGGGCGA TCAGCAGGCG 
CTCCATCCCT GGAAAGGTGA GACCATCCCG AATTACACCG GTCCTCAACC GCCTTACGAC 
TGGCTCAACA CCGATGGCAA ATATTCCTGG CTCAAAACGC CGCGCTACGA CGACATGCCG 
ATGGAAGTCG GTCCATTGGC GCGTATGCTC GTCGGATACG CTTCCGGTCA GCAACGCATT 
CAGGAGTTGG TCAACGCTGC ACTCAAACAG TTGGGAGTTG GTCCGGCGGC GCTCTTCTCG 
ACGCTGGGGC GCACAGCGGC GCGCGCCATC GAAACCGCGT TGATCGCCGA ACTGTTGCCG 
GGATGGATCG ACGAACTGGC GGCAAATATG GCGGCCGGCA ACCTGGTAGT TCACAACAGC 
GCCAAATGGA GTCCGGCGAA CTGGCCCCAG GAAGCGGTTG GTTGGGGATC GATGGAAGCG 
CCGCGCGGCT CGCTTGGGCA CTGGGTGCGG ATCAGAGATG GCAAGATCGT CAACTATCAA 
GCAGTGGTTC CGACGACGTG GAACGGCTCG CCACGTGATG CGCGCGATGT GCGCGGACCT 
TACGAAGCCG CACTGATCGA CACGCCGATT GCCGACCCGG AGCAGCCGAT TGAAATCCTG 
CGCACCATTC ATTCATTCGA CCCGTGCATG GCGTGCGCGG TTCACCTGGT GGATGCCCGT 
GGCATTGAGA TTACCCGCGT CCGGGTGCAG TGA

Protein sequence

MAKIAIDPIT RIEGHLRIEA QIERGRVVDA WSSSTMFRGM EIVLRGRDPR DAWVFAQRIC 
GVCTTVHALA SVRAVENALD IQIPDNARLI RNIIAGAQYV QDHVIHFYHL HALDWVDIVS 
ALKADPVKTS ELAQSISDWP KSSPAYFKGV QDRLQKFVDS GQLGIFGNAY WGHPAYALPP 
EANLMAVAHY LEALEWQKDV IRIHAILGGK NPHPQTYLVG GMAAPLDPNA QQAINTIRIA 
QLKMLADQVR TFVGKVYIPD ILAIASFYKD WAGLGAGVGN YLSYGDFPAA KDGNVASYWL 
PRGVIVNKNI DQKPQPVNHE RVTEYVAHSW FRYGEGDQQA LHPWKGETIP NYTGPQPPYD 
WLNTDGKYSW LKTPRYDDMP MEVGPLARML VGYASGQQRI QELVNAALKQ LGVGPAALFS 
TLGRTAARAI ETALIAELLP GWIDELAANM AAGNLVVHNS AKWSPANWPQ EAVGWGSMEA 
PRGSLGHWVR IRDGKIVNYQ AVVPTTWNGS PRDARDVRGP YEAALIDTPI ADPEQPIEIL 
RTIHSFDPCM ACAVHLVDAR GIEITRVRVQ