Gene Rcas_3850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3850
Symbol
ID	5541354
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5032273
End bp	5033691
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	64%
IMG OID	640895960
Product	hypothetical protein
Protein accession	YP_001433905
Protein GI	156743776
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.167663
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCGAC GACTGCACGC CGGGGTCGCA CGAACGGATA TTACGCCGCC ACCAGGCATT 
GCCCATGCCG GTTGGGGAGC GCAGACCCAT CAGCGGGCCG CCGGAGTCGA TCTGCCGCTC 
TGGGCGACGG CGCTGGCACT CTCTGATGGC ATCGAGACGG TTGTGATCGT CGATATCGAT 
CTGGTTTACC TCTGGGATGC CGAAGCGCCC GGCGTCATGC GAGCCGTGGA GCAGGCGACC 
GGTCTGCCAT CCTCACATAT CCGCCTTGCC TACACCCATA CCCACTCCGG TCCGATCAAC 
GGCGCAACCT GGAGTTCCTG GGTGAAGGAG GGCGCCGAGA TGACGCCAGC CTATGATGCG 
ATTCTGGAGC ATCATATCGC GGGCGTTGCC CGGCAAGCCT TGCAACGGAT GCGCCCGGTG 
CGCATCGCTG CCGGTTCCGG CGAGGCGCGG ATCAATGTCA ATCGGCGCTT TCGGCGCCCT 
GAAGATGGCA TGGTGGTTTG TGGGCGCAAT TGGGATGGTC CTGTTGATCA TCAGGTGCAG 
GTGGTGCGGC TCGACGATCT GGAGGGGGCG CCACTGGCAG TGATCGTGAA CTATGCCTGC 
CACCCGATTA CGGTCGGTCC TGATTGCGAC CTGATTACGC CCGATTATCC AGGGGTGATG 
AAGCGCGTCG TCGAACAGTC CACCGGCGCC ACATGTCTGT TTCTTCAGGG AGCAGCCGGC 
GATCTCGGAC CGATCCAGGG CGTCGCCCGC GGCGGTCTGG CTGAGTATCG GCGGTTGGGG 
AGCATCCTGG GCCACGAAGT GAGCCGGATC TGGTGGGAAC TCGAACCGTG GCGGCGGCGT 
GAGCGCTATG CCGGCACGCT GGAGTCCGGC GCGCCACTGG CGATCTACCA AGATGAGCGC 
CTGCCCGACC TCGATACCAC GCTCCGGGTT GGCGTGCGCG AGGTGCAATT GCCGCTGAAA 
CAGTTCGCCC CGGCTGCCGA GTTGGCGGCA GCGGCGGCGC AGCATATTGA GCGGCTCAAC 
CGTCTGCGCG CCGAAGGCGG CGATACTGAG GACATCCGCA CCGAGACGAT GCTGGCGAAG 
CGCGCCGGGA TGCGCGCCGA TCTTGCACGC CGCAATGAAG GTCATACCTA TCGCAGCGTG 
ACCCTGCAAA CCTTCGCCAT CGGCAACCAG ATCGCTCTGC CAGCCGTACC CGGCGAGCCG 
TTCTGCGAGA TCGGCAGGCG GGTGAAGGTC GGCTCGCCTT TCCCATACAC GCTCTTCTCC 
GGTTACGCGA ATATCGGCTG GGCGTACATC CCCACTGCCG ACGCTTATCC GCTGGGCGGC 
TATGAGATCG AGATTACACC GTTCGCGCCT GAAGCCGCCG ATATCCTGGT TGATGCAAGC 
CTGACGTTGT TGCGTGATAT GCTGCCAGAG CGGCGTTGA

Protein sequence

MARRLHAGVA RTDITPPPGI AHAGWGAQTH QRAAGVDLPL WATALALSDG IETVVIVDID 
LVYLWDAEAP GVMRAVEQAT GLPSSHIRLA YTHTHSGPIN GATWSSWVKE GAEMTPAYDA 
ILEHHIAGVA RQALQRMRPV RIAAGSGEAR INVNRRFRRP EDGMVVCGRN WDGPVDHQVQ 
VVRLDDLEGA PLAVIVNYAC HPITVGPDCD LITPDYPGVM KRVVEQSTGA TCLFLQGAAG 
DLGPIQGVAR GGLAEYRRLG SILGHEVSRI WWELEPWRRR ERYAGTLESG APLAIYQDER 
LPDLDTTLRV GVREVQLPLK QFAPAAELAA AAAQHIERLN RLRAEGGDTE DIRTETMLAK 
RAGMRADLAR RNEGHTYRSV TLQTFAIGNQ IALPAVPGEP FCEIGRRVKV GSPFPYTLFS 
GYANIGWAYI PTADAYPLGG YEIEITPFAP EAADILVDAS LTLLRDMLPE RR