Gene Rcas_3541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3541
Symbol
ID	5541040
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	4618527
End bp	4619873
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	59%
IMG OID	640895658
Product	hypothetical protein
Protein accession	YP_001433608
Protein GI	156743479
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0304193
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.186689
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACAAC GATCGCTTTT TGTAAGGGCG CTGCTTACCC TGATCGCAGG ATGGATCGCA 
TTGGGATTCG TCACGCCAGC AGCGGCAGTG GTGGTCACGC CAACAACTCC CGACGGTTGG 
GCGCCTGCCA ATGTGCGCAC CAATGCCACC GTCGCCATCA CCACGGCGCA ACCCCGTTCC 
GGCGCCGGTT CGCTCGAATT CACAACCAAT ACTATCACGC CAGGGCAGGA TAAGGCGGAC 
TATGAGAAAA CGTGGACTCC GACCGACTTT CCGGCACGCA CACTATCCGG GCTGACGGCG 
CTGAGCTACG AGTATTACCG CGACAGCAGC AGCACAACCC TTGCCCATCT GGCGCCGGTG 
TTGCGGTTGT ATGTAGTAGA TGTCACTCCC ACTTCGCCAA CCTTTGGCAA ATACGCGCTC 
CTGATCTGGG AACCGGCGTA CAATGGAACA ACGCCAACAC CGCCGGTCCC CACCGATCAA 
TGGATCACCC AGGACATCCT GAATGGCAAG TTTTGGCTGT TCGTGCCGTC TGGTCAATCC 
ATCCCCAGCG GTGTGGTTCA GAACTACAAT GTGACGCTCA ACGACTGGAT CACCGGTTCG 
CCGGTCGGTC AACCGGGCGA TCCGGCGCCG ATCAACATTG ATGCCAATAC GCTCGTGTTC 
GGTATCAATG TTGGCGTTGG CTCAGGATGG GGCGCGACGT TCCGCGGGTT CGTCGATAAT 
GTGACGGCAC GCTGGAGCAA TGATGAGGTC CACGCCAACT TCGAGCCTGA TCCGGCGTTC 
AGGTGCATCG ACATCCTGCT CGACGACTTC AACCGCGCCA ATACTACGAA AGGACTGGGC 
AGGAACTGGA CCGGGGCCAC CAACACCTAC CGCATTGCCG GTAATCAGGC GCAACCGTTT 
ACCACCGCCG GCACGATCTT CTGGAATGCA CAACCGCGCG TCTTTGGCGC TGATCAGGCA 
GCGTGCGTCA CTCTGGCGCA GATCGATCCG AACGGCAAGC ACCATACCCT TATCCTGAAA 
GCGCAATCGG TCACCAATTA CACGCGCGGC ATGATCCTGG TCAGCTACGA TGCCACATCT 
CAGCAGGTCA TTGTCGAGAC CGTCGAGCCG GGACAGTCGG GATGGACGAC GCGACTGAAC 
GTTCCGGTCG TGTTCAACCA TGGCGACGTG CTCGGCGCGC AGGCGCTGGC GGACGGATCG 
GTGAAGGTGT ATCGGAACGG TGTGCAGATC GGAACAGCGA CGACCTCGCC CTTCTTCGTT 
AATCGCGGCG GGCGGATCGG CGTTTGGTTC CATCAGACGT CAGGGGCGCT TTTTGACGAC 
TTTGGTGGCG GGAATACAAC GCCATAA

Protein sequence

MRQRSLFVRA LLTLIAGWIA LGFVTPAAAV VVTPTTPDGW APANVRTNAT VAITTAQPRS 
GAGSLEFTTN TITPGQDKAD YEKTWTPTDF PARTLSGLTA LSYEYYRDSS STTLAHLAPV 
LRLYVVDVTP TSPTFGKYAL LIWEPAYNGT TPTPPVPTDQ WITQDILNGK FWLFVPSGQS 
IPSGVVQNYN VTLNDWITGS PVGQPGDPAP INIDANTLVF GINVGVGSGW GATFRGFVDN 
VTARWSNDEV HANFEPDPAF RCIDILLDDF NRANTTKGLG RNWTGATNTY RIAGNQAQPF 
TTAGTIFWNA QPRVFGADQA ACVTLAQIDP NGKHHTLILK AQSVTNYTRG MILVSYDATS 
QQVIVETVEP GQSGWTTRLN VPVVFNHGDV LGAQALADGS VKVYRNGVQI GTATTSPFFV 
NRGGRIGVWF HQTSGALFDD FGGGNTTP