Gene RoseRS_4141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_4141
Symbol
ID	5211125
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	5186956
End bp	5188386
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	59%
IMG OID	640597730
Product	polysulphide reductase, NrfD
Protein accession	YP_001278435
Protein GI	148658230
COG category	[C] Energy production and conversion
COG ID	[COG5557] Polysulphide reductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTCAC AACCCGCACA GAAATCGGCG TATGGCAAGA TGCTTGAGGA GTTGCTGGGA 
CCGAAGCAGA GTTATGAATC GGTCACCAGA ACCATTGGCG ACATTGTGCT GACGCCGCTC 
AAGCGAACCC CGTGGGGTTG GGCGTTGGGG TTCGTCCTTG CAGCCCTGGG ATTGCTGATG 
TACCTCTACT CGCTGGCGGT GCTGTTTACC GTCGGCGTTG GCATCTGGGG GATTAATATC 
CCGGTTGCCT GGGGCTTCGA TATTATCAAC TTCGTCTGGT GGATCGGCAT CGGGCACGCC 
GGGACGCTCA TCTCGGCGAT TCTGCTCCTC TTCCGGCAGG ACTGGCGCAC CTCGATCAAC 
CGTGCTGCCG AGGCGATGAC GATCTTCGCC GTTGCGTGCG CCGGTATCTA CCCGCTGGTG 
CATACGGGCC GCCCCTGGCT CGATTACTGG ATGCTCCCCT ATCCTGGCAC GCTCGGTATG 
TGGCCGCAGT TCCGCAGCGC TCTGGAATGG GACGTGTTTG CGATCTCGAC GTATGCCACG 
GTCTCAATCC TGTTCTGGTA TGTCGGTCTC ATTCCCGACC TTGCTTCGCT GCGCGATCGG 
GCGACGAATA AGTGGGTCAA GATCTTCTAT GGCTTCCTGG CGCTCGGCTG GCGCGGCGGC 
GCCCGCGACT GGCATCGCTA TGAGATGGCG TCGCTCATTC TGGCAGGGCT TTCGACACCG 
CTGGTGCTGT CGGTGCACAG TATCATCAGC CTGGACTTCG CCATCTCACA GTTGCCCGGC 
TGGCACGTGA CGGTCTTCCC GCCCTACTTC GTTGCCGGTG CAGTCTACTG CGGCTTCGCA 
ATGGTGATCC TGCTGCTGAT ACCAATGCGC CGTTGGTACA AACTGCACGA TCTGATCACG 
ATGAAGCACT TCGACCTGAT GGGCAAGGTG ATGCTGGCGT CAGGTCTGGT GGTGGCGTAT 
GGCTATTTCG GTGAAATGTT CTATGCCTGG TACAGCGCCA ATATCTACGA GTACTTCCTG 
ATCACGAACC GCACGATGGG TCCGTACGCC TGGAGTTACT GGGCGCTGAT CGTGCTGAAT 
GTCGCCATTC CGCAACTGTT GTGGTTCAAG CGCTTCCGCG TCAGCCTGCC CTGGCTCTTC 
TTCATCTCGA TCTGTATCAA TATCGGGATG TGGTTCGAGC GCTGGGTGAT CATCGTGCTT 
AGCCTGCACC GCGACTTTAT GCCAGCGTCG TGGGGCTACT ACACGCCGAG TGTGTGGGAT 
ATCTCACTGT ACGCCGGTTC GTTCGGATGG TTCTTCTTCC TGTTCTTCCT GTTCATCCGC 
TTGTTGCCGG CGATCTCGAT CTTCGAGGTG CGCGACCTGG TGCATAAGAT CGAGGCAGAA 
CAGCACGCGC CGGTCCAGGT CGGCGGCGCC GGACACGTCA GGGAGGCGTA G

Protein sequence

MASQPAQKSA YGKMLEELLG PKQSYESVTR TIGDIVLTPL KRTPWGWALG FVLAALGLLM 
YLYSLAVLFT VGVGIWGINI PVAWGFDIIN FVWWIGIGHA GTLISAILLL FRQDWRTSIN 
RAAEAMTIFA VACAGIYPLV HTGRPWLDYW MLPYPGTLGM WPQFRSALEW DVFAISTYAT 
VSILFWYVGL IPDLASLRDR ATNKWVKIFY GFLALGWRGG ARDWHRYEMA SLILAGLSTP 
LVLSVHSIIS LDFAISQLPG WHVTVFPPYF VAGAVYCGFA MVILLLIPMR RWYKLHDLIT 
MKHFDLMGKV MLASGLVVAY GYFGEMFYAW YSANIYEYFL ITNRTMGPYA WSYWALIVLN 
VAIPQLLWFK RFRVSLPWLF FISICINIGM WFERWVIIVL SLHRDFMPAS WGYYTPSVWD 
ISLYAGSFGW FFFLFFLFIR LLPAISIFEV RDLVHKIEAE QHAPVQVGGA GHVREA