Gene Rcas_4244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4244
Symbol
ID	5541755
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	5484508
End bp	5486124
Gene Length	1617 bp
Protein Length	538 aa
Translation table	11
GC content	60%
IMG OID	640896351
Product	hypothetical protein
Protein accession	YP_001434289
Protein GI	156744160
COG category	[R] General function prediction only
COG ID	[COG1106] Predicted ATPases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.777185
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGAGC GTATCGTTAT TCATCGCTTC CGTGGCATTC GCCAGGGCGA TCTCAACCAT 
CTGCGGAAAT TTAATCTGTT TATCGGACCA AACAACAGCG GCAAGACCGC CATCCTCGAA 
CTGCTCTACC TGAGCGCAAC GAGTGGGCGA CCGGTTCAGT TCATCCGCGA CGATCTGCTG 
CCTGCCGAGA CCGGTGTGCT CAGAGCGACG ACATCGGCGC GCAGCGATCT GCTGGGCTAC 
GAGCCGCTGC CATACTTGCG CCAACGTCAT GGCAAGCACG GCGAGTGGGC CGGCAATCCG 
GCGGTGGTGA CACCAGAAGG CGGGTTGGAG ATCAACTTGC GCCGTGTGCC GAATAGCGAT 
GGCGCCCCTC CGTGGAACTC CTTTCGGCTG GCCGCACCAC TACCGGACTG GGGTGAGCAG 
GATGTGTATG CGTTTCGCAA GGAAGATATT GCCCGCATTG CGATGTTCAC CCTGCCGCAG 
CCAACGACGC TTGACCCCAG TATGATCCCA CCCACGATTG CCGAGGCCGG AGTCAGACCT 
GCCGGCGCAG CCACCGACAC GACCACCGCC GCACCGACAC CAATAACCGG TACAGCGACC 
GAAGCAGAGG AGGTGGGCAG CGCAGCCACT GACACGACCA CCGACACGAC CACTGACACG 
ACCACCGACA CGACCACCGC CGCACCGACA CCAATAACCG GTACAGCGAC CGAAGCAGAG 
GAGGTGGGCA GCGCAGCCAC CGACACGACC ACCGCCGCAC CGACACTAAC AACCGGTACA 
GCGACCGAAG CAGAGGAGGT GGGCAGCGCA GCCACCGACA CGACCACGAC GCCGATCTCC 
GATTGGCACT ACCTCTGGGA ACCGGACTGG GTGTACCGTT GGGATCGACA GGAACCCATT 
GATCGCCTGG CGGTCTGGGT CACGCAAGGA CGACGACCAC AGCCGCAGCA GGTCGTGTTC 
TTTTCCTCAC AGACGGCGAA TAGCCATTTC ACCGACCACT TTGCCAAGTG GGCCTATCAC 
AACGTCAAGG ACTGGCACGA AACGCTTGCC GAGCGGATGG CGCAGGTGTT TCCGGCACTG 
AAGGGAGCCA AGATTGAGGT GCTTGACGCG CCCGACGACC AACCGGGCCG AACCGGCTAT 
GTGCGCTTTC CGAACCGAAC GCCGCTGGCC ATCGATCAGT TCGGTGACGG CGCCCGTCAT 
GCGTTCAAGT TGCTCGCTGC CCTCACCGCC TTAGCCGCGA CGGTTGATGA CGATCATCCC 
GGCTTGCTCT TGTGGGAGGA GCCAGAGGTG TATATGCACG CAGCAACGCT CAACCGTCTG 
TTGCGCAGCG TAGCCGATAT TGTTGCTCAA AAGCCGATTC AAGTATGCAT CACTACCCAG 
AGTCTGGAAG TTCTGGCGTG GCTGATTCTC TATCTTGATC AACAACCGGC CATGCAACCG 
GATCAGATCA GCACGTTGCA TCTCAACCTG AAGGATGGAC AGTTGCACGT GCGTCCATTT 
ATTGGCAAAG CGCTCGGCGG ATGGTTCGAT TTCTTTGGTG ATCCGCGCCT GATTGAAGAA 
GACGAACTGG CTTCACCGCT GACACGCCTG TTGAGCATTC GGGAGGAACG TGAATGA

Protein sequence

MIERIVIHRF RGIRQGDLNH LRKFNLFIGP NNSGKTAILE LLYLSATSGR PVQFIRDDLL 
PAETGVLRAT TSARSDLLGY EPLPYLRQRH GKHGEWAGNP AVVTPEGGLE INLRRVPNSD 
GAPPWNSFRL AAPLPDWGEQ DVYAFRKEDI ARIAMFTLPQ PTTLDPSMIP PTIAEAGVRP 
AGAATDTTTA APTPITGTAT EAEEVGSAAT DTTTDTTTDT TTDTTTAAPT PITGTATEAE 
EVGSAATDTT TAAPTLTTGT ATEAEEVGSA ATDTTTTPIS DWHYLWEPDW VYRWDRQEPI 
DRLAVWVTQG RRPQPQQVVF FSSQTANSHF TDHFAKWAYH NVKDWHETLA ERMAQVFPAL 
KGAKIEVLDA PDDQPGRTGY VRFPNRTPLA IDQFGDGARH AFKLLAALTA LAATVDDDHP 
GLLLWEEPEV YMHAATLNRL LRSVADIVAQ KPIQVCITTQ SLEVLAWLIL YLDQQPAMQP 
DQISTLHLNL KDGQLHVRPF IGKALGGWFD FFGDPRLIEE DELASPLTRL LSIREERE