Gene Rcas_4094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4094
Symbol
ID	5541605
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	5307035
End bp	5308204
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	57%
IMG OID	640896206
Product	biotin carboxylase-like protein
Protein accession	YP_001434144
Protein GI	156744015
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.138669
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.680577
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATGA ACATCGTTTT TCTCTCACCG CACTTCCCGC CGAACTGGTA TCTGTTTTGC 
GTGCGCCTGC GCAATCTGGG CGCGAATGTT CTGGGCGTCG CCGACGAACC GTATGAACTG 
CTGCACCCGG ACCTGCGCAC TGCATTGACC GAATACTACC GGGTATCGGA TCTGCACCAT 
TACGACGAGG TGTTGCGTGC GCTCGGCTAT TTCACGCACC GCTATGGCAA AATCCAGCGG 
GTCGACTCCC TGAACGAATA CTGGCTGGAA ACCGAAGCGC GGTTGCGCAC CGATTTCAAC 
ATCGAAGGAC CGAAAATCAC CGATCTGCCC GGCATCAAGC GGAAATCGGA AATGAAGCGC 
CTTTTCACCC GCGCACAGGT GGACGTAGCG CGTGGGATTC TGGCGCATTC ACCGGCGCAG 
GTGCGCGCTT TCGCCGTTGA GGTCGGCTAC CCGCTCGTCG CCAAGCCGGA CGTTGGCGTC 
GGCGCGAATC ACACGTACAA GATTACGAGC GACGCCGAAC TCGATGCCTT CCTGTCGCGC 
CAGCCTGAGG GGTTTCTCAT CGAGGAGTAT GTGCATGGCG TCATTCAGAC TTTCGATGGA 
CTTGCAGACC GTGATGGCGA ACCGGTCTTC TTTACGTCGA TGCAGTACAG CAACGGTGTC 
CTGGAGGTTG TCAACAACGA CGACGATATT TACTATCTGA CCGAGCGTGA CATTCCGCCC 
GATCTCGAAC AGGCAGGGCG GCGCATCCTC AAGATATTCA ATGTGCGCGA ACGATTCTTT 
CACTTCGAGT TCTTCCGCAC TCCTAAAGGG CGATTGGTGG CGCTCGAAGT CAACATGCGT 
CCTCCGGGCG GGCTGAGCAT CGATATGTTC AACTACGCCG GCAACATTGA CCTGTACAAT 
GCATGGGCGA ATGTGTTGAT CAATCATCGC GTCAGCATCC CGCCGACGCG GCTGTACCAC 
GTCTGTTACG CTGGACGCAA ACCGTTCCGT TCCTATGCTT TGACCCACGA AGAGGTGCTG 
ATCCGCTTCG GCGATTGCAT CGTCCACCAC CAGCCGATGC ATCCGCTGTT TCATCGAGCG 
ATGGGTGCGT ATGCATATCT GATCAGATCG CCGGATCGCG CGGAAGTAAT TGCAATTGCG 
CAGGAGATTC AGCGGTTGAG CGTGTGTTGA

Protein sequence

MTMNIVFLSP HFPPNWYLFC VRLRNLGANV LGVADEPYEL LHPDLRTALT EYYRVSDLHH 
YDEVLRALGY FTHRYGKIQR VDSLNEYWLE TEARLRTDFN IEGPKITDLP GIKRKSEMKR 
LFTRAQVDVA RGILAHSPAQ VRAFAVEVGY PLVAKPDVGV GANHTYKITS DAELDAFLSR 
QPEGFLIEEY VHGVIQTFDG LADRDGEPVF FTSMQYSNGV LEVVNNDDDI YYLTERDIPP 
DLEQAGRRIL KIFNVRERFF HFEFFRTPKG RLVALEVNMR PPGGLSIDMF NYAGNIDLYN 
AWANVLINHR VSIPPTRLYH VCYAGRKPFR SYALTHEEVL IRFGDCIVHH QPMHPLFHRA 
MGAYAYLIRS PDRAEVIAIA QEIQRLSVC