Gene Rcas_3664 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3664
Symbol
ID	5541166
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4792077
End bp	4793141
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	60%
IMG OID	640895784
Product	hypothetical protein
Protein accession	YP_001433731
Protein GI	156743602
COG category	[C] Energy production and conversion
COG ID	[COG1592] Rubrerythrin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.60307
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGATGCG GTACAATGCA TGCCAGATGG TTCCGATTGA ACAAAGAAGC GTATTGCCGT 
ATGACCGATT CGGATCGTGA AGCGCGCCAG ATGTTCGCTC TCGGGAGCAT GGGACATGTC 
GCATACCATT TATGGGCGGA ACAGGCGCGG CGAGAGCATC GTTTCAATCT TGCCCGCTTG 
TTCGATGCGT TGAGCGCTGC GCGACTGGCG CGCGCCGGTC AGGCGTTTCG TCGTTTGAAT 
TGGGTGCGCT CGACGGCTGA AAATGTCGTC AGCGCCTTTT CTGGCGCAGT CATTGGTGAT 
ATCGACGCTG ATCGGATCAC CGGCGTGACG CCGCTTGCGC GGGAGTTGCT GGCGCGGGCG 
CAGCGCGCCG TAAGTGAGGG ACGCGATCTG CGCGCCGGGG AGCTTGGCGA TCTGTTCGTC 
TGTACGACGT GTGGCGAGAT CTGCGAAGGT AAACTCGAAG GCGCCTGCCG ACGCTGTGGC 
ACCGTTCCCG AAGCGCATCG GGCATTTCGG GCCATTGAAG CGATGGGTAC GCTTGGTCCG 
CATGCGATTA TGGCATTTCT GGAACGGACG GAAGAGGCGC TGCGCACCCT TGTGGCGGGT 
CTCGACGACG ATTTCCTCGC GCGTCGCCTG AACGACGCCA CGCCATCGCT TAAGGAGTTG 
ATCGGTCATC TTGCCGATAT GGACGCGATC TTTCGTCAGC GCGCCTGGTT GCTCCTCGAA 
ACCAATCAGC CGACGCTTTC ACCCGCACAC CCGCCATCGC TCGAATCTGC GGCAATGTAC 
CGCGACCAAC CGATAGATGC TGTGCTCGAT GCCTATCATA CGACACGCGC GCAGACGTTG 
AGTCTGTTGC GTGGGTTGAC CAGCGCCGCC TGGCATCGCG AAGGGTATCA CGAGGTGTAT 
GGGGTGATCA ATCTGTTGCA CCAGGCGAAC TGGCTCATTT CGCACGAACG AGCGCATCTC 
GTCGAAATGG CGCAGATCCG TCACGACCTG ATCGCAACTG ATCGGCGCTA CGCTGAGACG 
ACGGTTGCGG ACATTGTTGT GACCGCTTCG AACGAAGGCG AGTGA

Protein sequence

MRCGTMHARW FRLNKEAYCR MTDSDREARQ MFALGSMGHV AYHLWAEQAR REHRFNLARL 
FDALSAARLA RAGQAFRRLN WVRSTAENVV SAFSGAVIGD IDADRITGVT PLARELLARA 
QRAVSEGRDL RAGELGDLFV CTTCGEICEG KLEGACRRCG TVPEAHRAFR AIEAMGTLGP 
HAIMAFLERT EEALRTLVAG LDDDFLARRL NDATPSLKEL IGHLADMDAI FRQRAWLLLE 
TNQPTLSPAH PPSLESAAMY RDQPIDAVLD AYHTTRAQTL SLLRGLTSAA WHREGYHEVY 
GVINLLHQAN WLISHERAHL VEMAQIRHDL IATDRRYAET TVADIVVTAS NEGE