Gene Rcas_4179 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4179
Symbol
ID	5541690
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	5408961
End bp	5410016
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	64%
IMG OID	640896290
Product	oxidoreductase molybdopterin binding
Protein accession	YP_001434228
Protein GI	156744099
COG category	[R] General function prediction only
COG ID	[COG2041] Sulfite oxidase and related enzymes
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0370615
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.000000000255221
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGCGACCAC GCACAACAGA CTGGAGCCTG GCGCTGGCAA CCGGCGCTGC GTTTGCGACC 
GGTCTCTGGA CGTTAACCAC CGGGCAAGTT GAAGGATGGT GGGTGTTTGC GCTCCATGGC 
GCGACCGGTT ATCTGACGTT TCTGCTTCTG ATCCCCAAAC TTGTGCGCGT TCGCAACCGT 
CTGCTGCCCG GAATTCGGTC TCCCCGCGCC TGGGCTGGGC TGGCAACCAC GGCGCTGGCG 
CTTCTCACGC TTGTCTGCGG CATTGCCTGG GTGAGCGGCG GCGGCATCGT TGTGCTCGGC 
TACAATCTGC TTAACTGGCA TATTCTGTTC GGTCTGGTGT TGACCGTGCT TCTTTCAGCG 
CACATGGTTG TTCGCGCAAA ACCGCTCCGC ACGGAAGACC GTTCGCGACG GCAGGCGCTG 
CGCGCAGGGG CATTTGCGCT AGGGGCAGCG TTGATCTGGC CCCTTCAGGA GCGTCTCATT 
GGTACATTGG GGCTGCCGGG AGCGCAACGG CGCTTCACCG GTTCACGTGA GGTCGCCAGT 
TTCAGCGGTA ATGGATTTCC AATCGTCAGT TGGATGGCGG ATCGCCCTGC GCCGCTGGAC 
GTGGCGACCT GGCGTTTGCG CGTGACCGGT CTGGTTAGCG AGTCATTCGC CGTCAGCCAC 
GATGAACTCG ATGCGCGCGA TGAACTGACG GCAACGCTCG ATTGCACTGG CGGCTTCTAC 
ACCACGCAGC ATTGGCGCGG CACACGGGTC GGCGCGCTGC TCGACCGCGC CGGGGTGCTG 
CCGGAGGCGC GCTGGGTGCG GTTTGTGTCG GTCACAGGCT ATCGCTGGAG CCTGCCGCTG 
GAACAGGCGC GCGAGACGTT GATCGCAGTG CGGGTTGGCG GCGAACCGCT CAGCCACGGG 
CACGGCGCGC CTGCCCGCCT CGTCGCTCCC GGCGAACGCG GGTTTGTGTG GGTTAAGTGG 
CTGGCGCTCA TCGACGTGCG CGCCGAGCCG GACCCGGCTC AATTGGTGGC GATCAATGTG 
AGCGGGTTTG TTGCCTCGGA TGATGTTGGG GGATGA

Protein sequence

MRPRTTDWSL ALATGAAFAT GLWTLTTGQV EGWWVFALHG ATGYLTFLLL IPKLVRVRNR 
LLPGIRSPRA WAGLATTALA LLTLVCGIAW VSGGGIVVLG YNLLNWHILF GLVLTVLLSA 
HMVVRAKPLR TEDRSRRQAL RAGAFALGAA LIWPLQERLI GTLGLPGAQR RFTGSREVAS 
FSGNGFPIVS WMADRPAPLD VATWRLRVTG LVSESFAVSH DELDARDELT ATLDCTGGFY 
TTQHWRGTRV GALLDRAGVL PEARWVRFVS VTGYRWSLPL EQARETLIAV RVGGEPLSHG 
HGAPARLVAP GERGFVWVKW LALIDVRAEP DPAQLVAINV SGFVASDDVG G