Gene Rcas_2334 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2334
Symbol
ID	5539815
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	3010976
End bp	3012634
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	63%
IMG OID	640894467
Product	cobalamin B12-binding domain-containing protein
Protein accession	YP_001432435
Protein GI	156742306
COG category	[R] General function prediction only
COG ID	[COG5012] Predicted cobalamin binding protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.769724
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAAA AACAAAAAAC CGTTGTCGCC GCTGCGCTCG GCGAATGTGT GCATGTTGCC 
GGCGTGATGA ACTTTCTGCG CCTGGCGGAA GAAGCCGGCT GGCGCACGGT CTTTCTGGGT 
CCGGCCACGC CGATTGAGCG GGTGCTCGAA GCCGCGCGAC AGGAGCAGGC CGATCTGGTT 
GGCGTGTCCT ACCGCCTGAC GCCGGAAACC GGCGCGCATC TCCTGGGGCG TTTCGCCGAA 
GCGGCAGACG ATCTGCATGC CGCAGGGGTG CGTTTCGCCT TCGCCGGAAC GCCGCCGCTG 
GCGGAGAAAG CCGCCACGCT CGGTTTCTTC GAGCAGGTGT TCGATGGCAG CGAACCGGCC 
GATCAGGTTC TGGCATATCT CAGGGGGCAA AATCCGGCAC ACGCAACCGA GGCGGATTTT 
CCGCAACGCA CCGTTGACCG CATTCGCTGG AAAGCGCCAT TTCCCCTGAT CCGTCATCAC 
TTTGGTCTGC CGACGATGCA GGCGACCATC GATGGCATTG CGCGCATCGC CGAAGCGCGC 
TGTCTCGATG TGATTTCGCT CGGCACCGAT CAGGACGCCC AGGAGAACTT TTTCCGCCCC 
GAACGTCAGG ACCCGGCGCG TACCGGCGCC GGCGGCGTGC CGGTGCGTAG CGCCGACGAC 
TATCGCGCCC TCTACGCTGC CAGTCGACGT GGCAACTACC CGCTTATGCG CACCTACTCC 
GGCACTGATG ATTTCGTGCG CCTGGCAGAG TTGTATGTCG AAACGATCAA CATCGCCTGG 
TGCGCCATCC CGCTCTTTTG GTTCAACCGC ATGGACGGGC GCGGACCGTG GGACCTGGAA 
GGGTCGATCC GCGAACATCA GACGATTATG CGCTGGTATG GCGAGCGGGA CATTCCGGTT 
GAACTCAATG AGCCGCACCA TTGGGGCATG CGCGATGCGC CCGATACGGT CTTTGTTGCC 
AGCGCCTATC TCTCGGCGTA CAATGCGCGC GCGTTCGGCG TGCGCGACTA TATCGCGCAA 
CTGATGTTCA ACAGCCCGCC CGGTTTGTCC GATGCCATGG ACCTGGCAAA GATGCTGGCG 
GTGATCGAGA TTACTGCGCC GCTGGCAGGA CCGGATTTCC GCATCTGGAA ACAGACCCGC 
ACCGGGTTGC TGAGTTACCC GGTTGATCCG GCTGCGTCGC GGGCGCATCT TTCGGCAAGC 
ATTTACCTGC AAATGGCGCT GCGTCCGCAC ATCATTCACG TCGTTGGGCA TACCGAAGCG 
CACCATGCTG CCACCGCCGA TGATGTGATC GAAGCATGCG GCATAGCTCG CCGCGCTATT 
GAAAACGCGC TGCGCGGGCA ACCCGACATG ACCGCCGATC CGTCCGTGCG CGCGCGAGCG 
GCGCAACTGG TCGAAGAAAC CCATCTCCTC CTCAATGCGA TGGCGCAACT TGCGCCTCCC 
GGCGTGACCG ACCCGCTGAC CGACCCCGCC ACACTGACGA AAGCCGTGGA GATTGGACTG 
CTCGATGCTC CGCAATTGCG CAATAACCCG TTCGCACCGG GTCGCGTCGC AACCCGCTTC 
ATCAACGGCA TGTGCCTGGC CGTCGATGCG CAGGGACGCC CGCTCGACGA GAAAGAACGC 
ATCCGACTGG CGCTGGATCA TGCAACAATG TCAGCCTGA

Protein sequence

MTEKQKTVVA AALGECVHVA GVMNFLRLAE EAGWRTVFLG PATPIERVLE AARQEQADLV 
GVSYRLTPET GAHLLGRFAE AADDLHAAGV RFAFAGTPPL AEKAATLGFF EQVFDGSEPA 
DQVLAYLRGQ NPAHATEADF PQRTVDRIRW KAPFPLIRHH FGLPTMQATI DGIARIAEAR 
CLDVISLGTD QDAQENFFRP ERQDPARTGA GGVPVRSADD YRALYAASRR GNYPLMRTYS 
GTDDFVRLAE LYVETINIAW CAIPLFWFNR MDGRGPWDLE GSIREHQTIM RWYGERDIPV 
ELNEPHHWGM RDAPDTVFVA SAYLSAYNAR AFGVRDYIAQ LMFNSPPGLS DAMDLAKMLA 
VIEITAPLAG PDFRIWKQTR TGLLSYPVDP AASRAHLSAS IYLQMALRPH IIHVVGHTEA 
HHAATADDVI EACGIARRAI ENALRGQPDM TADPSVRARA AQLVEETHLL LNAMAQLAPP 
GVTDPLTDPA TLTKAVEIGL LDAPQLRNNP FAPGRVATRF INGMCLAVDA QGRPLDEKER 
IRLALDHATM SA