Gene Rcas_1973 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1973
Symbol
ID	5539451
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2525747
End bp	2527591
Gene Length	1845 bp
Protein Length	614 aa
Translation table	11
GC content	65%
IMG OID	640894108
Product	hypothetical protein
Protein accession	YP_001432079
Protein GI	156741950
COG category
COG ID
TIGRFAM ID	[TIGR02226] N-terminal double-transmembrane domain

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTTTC TTCTGCCACT CGGATTACTG GCATTGCTTG CCCTGCCGCT CATCGTGCTG 
CTCCATTTCC TGCGCGAACG GCGGCGACGC GTGCCAACAC CAAGCCTGCT GCTCTGGGCA 
AACCTGCCAC GCCGCGTGGA AGGCGAGCGC AGCCGCCGCC TGCCGCTGAC CCTGCTGCTG 
CTCCTCCACC TCCTGATTGC CACGCTGCTC GGCGTTGCGC TGGGGGGACC GCAGATCACC 
GGTGCGCTCA CGCCCGACGC GCGCCATACC GCCATTATTC TCGACACATC CACCAGCATG 
GCAGCCGTTG ACGGCGGCGC GAGCCGTTTC GACCAGGCGC GCCGGCGCGC ACGCGCTATT 
GTCACCTCTG CCTCTCCCGG TGACCGGATC ACGCTGATCG CTGCCGGACC GCGGGCGCAG 
ATCGTGGCAT CCGGCGACGA CCCCTTACTG ATCACTGCCG CGCTCGACCG CCTTCAGCCC 
GGCGGCGTTG GCATGGCGAT CAATGAGGCG TTGACGCTGG CAGAAGCCGT GCTCGACCCA 
CAGTTCAGCC GACGGATCGT GGTCCTGACC GATAGCGCGT TACCGCCGCA ACCTGCGCGC 
GATATGATTG TGCCCATCGA ATGGGTGTCG ATAGGATCGA ATGTGCCGAA CCGCGCGATC 
ATTGCGTTTG CCAGCCGTCC CTGGGGCGGT CGCCTCCAGG TGTATGCGCG GGTCGCCAAT 
TATGACGCCA CAGCCTTCAA TGGAACGCTC CAGGTCTTCT CCGACAATCA GGTCGTTGCA 
GAAGAACGAG TCGCCATTGC GCCGAACGGC GAAACGGAGG TCAGTTGGAC GCTGCCCGGC 
GGAATTGAGG CGCTGCGCGC CACCATCGAT GGGCGCGATG CGCTGCCACA GGACGATGTC 
GCATACCTCA GCGTGTCGCA GGGGCGCCCG ATTCTGGCGT TGCTGGTGTC GAACGAGCCG 
GCCGCCCTTC GCCGCGCGCT CGCAGCCATA CCCGGCGTGA CGGTCGTTGT GACGAACCCT 
GCCGCCTACG CGGACACGCC GGAGCGATCT GCCGCAGACC TGACAATCTT CGATGGTTTT 
CTGCCGGATG CCTGGCCCCA GGGCGCTATT CTGTCAATCG CCCCACCCTC TGGATCGTCG 
CTGTTGAATG TAGCGTCCGA CACACGCGAA CCAGAACCGG GCAAGCCGTT GCACCAACGA 
GGGAATACGC TCCAGGGGAT CGAGTTCGGC GGCGTGGTGT TTGGCGCCGT CCGCATCGTC 
GAGGCGCCAC CATGGGCTGA GGTGCAGTTG TCGTTCGAGA ATACGCCGCT GATCCTCCGA 
GGACGAACCG ACAATCACGA AATTGCGATC TGGACGTTCA ATCTTGCCAG CAGCAACCTG 
ACGACACGCC TGGCATTTCC GATCCTGGTT GCGCGCACCG TGCGCGACCT GGCGCCACCG 
CCGTTGCCGC AGGCGGTGCG CGCCGGCGAG CCACTGGTCA TCCGACCCGA CCCGCGCACG 
ACAACCCTGC GACTGCGTGG TCCTGACAAC CGGCAGATTA CCGCGCCGGC AGCATCGGTT 
GTCACCCTCG ATACGCTGAT CGAGCCGGGG TTGTACCGCG TGGAAGAACA ACGCAACAAT 
ATCACCGTTC CGGTTGGCAT GGTCGGAGTC AATGCAGGAG CGGCAATCGA ATCAAACCTG 
CGCCCACAGA ACGCACCGCC GTTGCGTGCG CCGGGAACCG ACCCCGGCAG CGCAGCGGGA 
CGACAGACGC TCGATCTATG GCCCTGGCTG GCGCTGGCTG CGCTCCTGGT TCTGGCGCTG 
GAATGGGCGT ATGTGTTGCG CCGACGCGAG AAAGTGTTCA CATGA

Protein sequence

MSFLLPLGLL ALLALPLIVL LHFLRERRRR VPTPSLLLWA NLPRRVEGER SRRLPLTLLL 
LLHLLIATLL GVALGGPQIT GALTPDARHT AIILDTSTSM AAVDGGASRF DQARRRARAI 
VTSASPGDRI TLIAAGPRAQ IVASGDDPLL ITAALDRLQP GGVGMAINEA LTLAEAVLDP 
QFSRRIVVLT DSALPPQPAR DMIVPIEWVS IGSNVPNRAI IAFASRPWGG RLQVYARVAN 
YDATAFNGTL QVFSDNQVVA EERVAIAPNG ETEVSWTLPG GIEALRATID GRDALPQDDV 
AYLSVSQGRP ILALLVSNEP AALRRALAAI PGVTVVVTNP AAYADTPERS AADLTIFDGF 
LPDAWPQGAI LSIAPPSGSS LLNVASDTRE PEPGKPLHQR GNTLQGIEFG GVVFGAVRIV 
EAPPWAEVQL SFENTPLILR GRTDNHEIAI WTFNLASSNL TTRLAFPILV ARTVRDLAPP 
PLPQAVRAGE PLVIRPDPRT TTLRLRGPDN RQITAPAASV VTLDTLIEPG LYRVEEQRNN 
ITVPVGMVGV NAGAAIESNL RPQNAPPLRA PGTDPGSAAG RQTLDLWPWL ALAALLVLAL 
EWAYVLRRRE KVFT