Gene Rcas_1861 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1861
Symbol
ID	5539339
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	2378160
End bp	2380103
Gene Length	1944 bp
Protein Length	647 aa
Translation table	11
GC content	65%
IMG OID	640893999
Product	putative molybdopterin biosynthesis protein MoeA/LysR substrate binding-domain-containing protein
Protein accession	YP_001431970
Protein GI	156741841
COG category	[H] Coenzyme transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0303] Molybdopterin biosynthesis enzyme [COG1910] Periplasmic molybdate-binding protein/domain
TIGRFAM ID	[TIGR00177] molybdenum cofactor synthesis domain

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.72567
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACGAC GACGCTACTA TCTTGAGGAT CGCGCCCTGG ATGATGCGGT AGCCCGCTTT 
GAGGCGGCGA TTGAGCGCGT TGGCGGACTG CATCCGCTGG ACGGCGAGAC TGTTCCTCTG 
GCTGAGGCGC GGGACCGCGT CACAGCCGCT CCGGTGTGGG CAGCCCGTTC TGTGCCTCAC 
TACCACGCAG CAGCCATGGA TGGCATCGCC GTGCGCGCCG CCACGACCGC CGGCGCGACC 
GAGTCGTCGC CGCTGACCCT CGCGCTTGGC GAGCAGGCAG TCTGGGTCGA TACCGGCGAC 
CCGATGCCGC CCGGCGCTGA TGCTGTGGTG ATGGCCGAGC ACGTTCAGGT GCTCGACGAT 
ACGACTGTGG CGATCACCGC TGCGGTAGCG CCTTGGCAGC ATGTGCGACC GATGGGTGAG 
GACATCGTTG CGACCGAACT GGTCGTCCCT GAAGGTGTGC GCTTGCGCCC GGTCGATCTG 
GGAGCGATCG CTGCCGCCGG TCACGCAACT GTCAGCGTGC GGCGACGTCC GCGTGTGGCG 
ATTATCCCCA CCGGCACCGA GTTAGTCACG CCCGAAGCGG CTGCCGAGCG CGAGGCGATA 
GGTCATCCGG TGCGCGCCGG TGAGATCATC GAGTTTAACT CACTGATCCT CTCCGGTATG 
GTCGAGGAGT GGGGCGGCCT GCCTACGCGC CTGCCCCCTG TGCCTGACCG GCAGGATTTG 
TTGCGTGCTG TCATTGTGAG CGCTATCGAC CACCACGATG TCATTGTGGT CAATGCCGGA 
TCGTCAGCCG GCGCCGAGGA CTACACGGCG ACCGTGCTCG CTGAACTTGG CGAGGTGGCC 
GTCCATGGAG TGGCTATTCG TCCCGGACAC CCCGTGATCC TCGGTGTGGC GGGCGGGAAG 
CCGGCTCTGG GACTGCCCGG CTATCCCGTA TCGGCAGCGC TCACCGCCGA ACTGTTCCTC 
CGTCCACTGC TGTACCGGCT CCTGGGTCTC ACCCCGCCGC CCCGCCCTGA GGTGACGGCG 
ACGATCAGTC GCAAACTGCT CTCGCCGCTG GGCGAGGATG AGTTCGTGCG CGTCACGCTG 
GGTCGGGTGG ATGGGCGACT CATCGCTACG CCGCTGGCGC GGGGTGCGGG TGTGGTGATG 
TCCCTTGTTC GTGCCGACGG ACGCGCGCGC ATTCCCCGTT TCTCCGAGGG TCTCCATGCA 
GGCGCCGAGG TTACTGTCGA ACTCCTGCGC GATCAGGCTG AGATTGAGTC AACCATCGTT 
GTCATCGGCA GCCACGATCT GGCGCTCGAC CTGCTGGCAA GTCATGTGCG ACGCGCCGGT 
CGGCGCCTCA GTTCAGCCAA TGTGGGCAGC CTGGGCGGTC TGATGGCGCT TAAGCGTCGC 
GATGCCCACC TTGCTGGCGT GCACCTCCTT GATGAGGAGA CCGGCGAGTA TAACGCCTCG 
TATATACGGC GTCTATTGCC GGACGAAGAG ATTGTGCTGG TTCATCTGGC GTACCGCGAG 
CAGGGCTTTC TCGTGGCGCC GGGTAACCCG CTTGGGCTGA GCAGGCTGCG TGATCTGGCG 
CGTCCCGGCG TGCGCTTCGT CAACCGGCAG CGTGGATCGG GGACACGTAT GCTGCTCGAT 
TATCAATTGC GTCTGGAAGG GATAGACCCC AGCGCCATTA CCGGCTATCA GCGCGAGGAG 
TTCACGCACA TGGCGGTTGC TGCGGCAGTG CAGAGCGGCG CTGCGGATGT GGGTCTTGGT 
ATCAGCGCCG CTGCGCGCGC TCTTGGTCTT GCCTTTATCC CCCTCTTCAG CGAGCGCTAT 
GATCTGGCCG TTCCGCGTCG TCACTGGGAG AGCGAGTTGT TGGCGCCACT GCGGCAGATA 
CTTTTCGAAT CGGCGTATCG CAGCGCCGTC GAATCGCTGG GTGGCTACAA CGTGGATCGG 
ATGGGTGAAG AGGTGCGGGT CTGA

Protein sequence

MSRRRYYLED RALDDAVARF EAAIERVGGL HPLDGETVPL AEARDRVTAA PVWAARSVPH 
YHAAAMDGIA VRAATTAGAT ESSPLTLALG EQAVWVDTGD PMPPGADAVV MAEHVQVLDD 
TTVAITAAVA PWQHVRPMGE DIVATELVVP EGVRLRPVDL GAIAAAGHAT VSVRRRPRVA 
IIPTGTELVT PEAAAEREAI GHPVRAGEII EFNSLILSGM VEEWGGLPTR LPPVPDRQDL 
LRAVIVSAID HHDVIVVNAG SSAGAEDYTA TVLAELGEVA VHGVAIRPGH PVILGVAGGK 
PALGLPGYPV SAALTAELFL RPLLYRLLGL TPPPRPEVTA TISRKLLSPL GEDEFVRVTL 
GRVDGRLIAT PLARGAGVVM SLVRADGRAR IPRFSEGLHA GAEVTVELLR DQAEIESTIV 
VIGSHDLALD LLASHVRRAG RRLSSANVGS LGGLMALKRR DAHLAGVHLL DEETGEYNAS 
YIRRLLPDEE IVLVHLAYRE QGFLVAPGNP LGLSRLRDLA RPGVRFVNRQ RGSGTRMLLD 
YQLRLEGIDP SAITGYQREE FTHMAVAAAV QSGAADVGLG ISAAARALGL AFIPLFSERY 
DLAVPRRHWE SELLAPLRQI LFESAYRSAV ESLGGYNVDR MGEEVRV