Gene RoseRS_3539 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_3539
Symbol
ID	5210517
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	4433698
End bp	4435122
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	62%
IMG OID	640597135
Product	nickel-dependent hydrogenase, large subunit
Protein accession	YP_001277847
Protein GI	148657642
COG category	[C] Energy production and conversion
COG ID	[COG3259] Coenzyme F420-reducing hydrogenase, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCGTC ACATCCTGAT CGATCCGGTC ACCCGGATCG AAGGACACGC GAAAATCAGC 
ATCCATCTGG ACGACGACGG AAACGTGGCA GAGGCGCGTT TCCATGTGAC TGAGTTTCGC 
GGGTTTGAGC GCTTTTGCGA GGGACGACCA TTCTGGGAAA TGCCCGGCAT TACGGCGCGC 
ATCTGCGGGA TCTGCCCGGT CAGCCATCTG CTGGCATCGG CGAAGGCAGG TGACGCGATC 
CTCTCGGTAG TGATCCCGCC AGCAGCGGAG AAACTGCGCC GCCTGATGAA CCTGGGGCAG 
ATCGTGCAAT CGCACGCGCT GAGTTTCTTT CATCTCAGTG CGCCCGATCT GCTGCTCGGT 
TTCGACAGCG ATCCCGCCAC GCGCAATGTC TTTGGATTGA TGGCTGCCGA TCCGACGCTG 
GCGCGTGCCG GAATACGGCT TCGCCAGCTG GGGCAGGACA TTATTGCTCT GCTCGGCGGC 
AGCAAAATCC ATCCGGCGTG GGCTGTGCCG GGCGGTGTCC GCTCTGCGCC GACCGCCGCA 
CAACGCGCCG GGATCATTGA GCGCTTGCCC GAAGCGCGCG CCACGGTGCT CGATGCACTA 
CGTCGGTTCA AGGCGTTGCT CGACACCCAC GCCGACGAAG TTGCGACATT TGGCAATTTC 
CCGTCACTTT TCCTGGGATT GGTAGGACCA AACGGTGAAT GGGAGCACTA CGATGGGCGT 
TTGCGTGTGG TTGATTCGGG TGGCGCCATC ATCGCCGATC AGGTTGATCC ATCGCGCTAT 
CGCGACATTA TCGCCGAAGC GATCGAGCCG TGGTCATACC TGAAGATGCC GTACTACCGA 
CCACGTGGCT ACCCTGGCGG CATGTACCGC GTCGGTCCGC TGGCGCGTCT CAATATCTGC 
ACCCGCATCG GCACCCTGCT GGCAGACGCC GAACTGGGGG AGATGCGCCA GCGTGCAGGG 
GGTATCGCTA CATCGTCGTT CTACTACCAC TACGCGCGCC TGATCGAGAT TCTGGCGGCG 
CTGGAGCGCA TTTCGTTGAT CCTCGACGAT CCTGATCTCG ATTCGCCCCG CCTCCGCGCC 
GAAGCGGGAG TCAACCGGTT TGAGGGCGTC GGCGTGAGCG AAGCGCCACG CGGAACCCTC 
TTCCACCACT ACACCGTCGA TGCGCACGGC TTGATCCAGC GCGTCAATCT GATTATCGCC 
ACGGGACACA ACAATCTGGC GATGAACCGG ACGATTGCCC AAATCGCGCG GCACTTTGTG 
CACGGCGATC GGATCGGCGA AGGGGCGTTG AACCGGGTGG AGGCAGGCAT CCGCGCCTAC 
GATCCGTGTC TCAGTTGTTC GACGCATGCC GCTGGAACGA TGCCGCTGAC GCTCACACTG 
GTCGCCGCTG ATGGTACGGT GCTCGATGAG GTGCGGCGGG GGTGA

Protein sequence

MTRHILIDPV TRIEGHAKIS IHLDDDGNVA EARFHVTEFR GFERFCEGRP FWEMPGITAR 
ICGICPVSHL LASAKAGDAI LSVVIPPAAE KLRRLMNLGQ IVQSHALSFF HLSAPDLLLG 
FDSDPATRNV FGLMAADPTL ARAGIRLRQL GQDIIALLGG SKIHPAWAVP GGVRSAPTAA 
QRAGIIERLP EARATVLDAL RRFKALLDTH ADEVATFGNF PSLFLGLVGP NGEWEHYDGR 
LRVVDSGGAI IADQVDPSRY RDIIAEAIEP WSYLKMPYYR PRGYPGGMYR VGPLARLNIC 
TRIGTLLADA ELGEMRQRAG GIATSSFYYH YARLIEILAA LERISLILDD PDLDSPRLRA 
EAGVNRFEGV GVSEAPRGTL FHHYTVDAHG LIQRVNLIIA TGHNNLAMNR TIAQIARHFV 
HGDRIGEGAL NRVEAGIRAY DPCLSCSTHA AGTMPLTLTL VAADGTVLDE VRRG