Gene Rcas_3359 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3359
Symbol
ID	5540858
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4387729
End bp	4388889
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	62%
IMG OID	640895477
Product	carbamoyl-phosphate synthase, small subunit
Protein accession	YP_001433427
Protein GI	156743298
COG category	[E] Amino acid transport and metabolism [F] Nucleotide transport and metabolism
COG ID	[COG0505] Carbamoylphosphate synthase small subunit
TIGRFAM ID	[TIGR01368] carbamoyl-phosphate synthase, small subunit

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.663891
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACAC GAACATACGC AATGCTGGCG CTGGAGGACG GTACGATCTG GCATGGATAT 
GCGCTGGGGG CGATTGGCGA GCGCACCGGT GAGGTCGTGT TCAACACCTC GATGACCGGC 
TACCAGGAAG TGTTGACCGA TCCATCCTAT TATGGCCAGA TTGTGGTGAT GACGGCGCCG 
CACATCGGCA ACACCGGCGT TAACCGCGAA GATGAAGAAA GCCGTCATCC CTGGGTCGCC 
GGTTTTGTGG TGCGCGCCGC AAGTCCGTAT GTCTCCAACT GGCGCGCTGC GCAGTCGCTC 
CATGAGTACC TGGCGGAACA CGGTATCGTG GCAATGACCG GAGTCGATAC CCGCGCGCTG 
GTGCGCCATA TTCGCACGCA AGGCGCAATG CGCGCCGTCA TCTCGTCGGA GAACCCGGAG 
CCGGATCGCC TGATCGCCGC TGCGCGCGCC GCGCCGTCGA TGAATGGGCT TGACCTGGTG 
CCGTATGTGA CCTGCGCTGA GCCGTACCAC TGGGTCGAGG GCAATCCAGG CGAGTGGGGA 
CCGGGCGAAA CGCCAGCACA ACGTGGTGAA TCGACATTTC ACGTGGTCGC CTACGACTTT 
GGGATCAAGC GCAATATTCT GCGGTTGCTG GCAGAGCACG GTTGTCGCGT GACGGTCGTG 
CCCGCCACCA TGCCGGCTGC CGACGTCCTG GCGCTCGAAC CCGATGGTGT GTTTCTCTCG 
AATGGACCGG GCGATCCGGC GGCGGTGACG TATGGCGTCC AGGCAGTGCG CGATCTGCTG 
GGCAAAACTC CTGTGTTCGG CATCTGCCTG GGGCATCAGA TTCTTGGTCT GGCGCTCGGC 
GGCACGACCT ATAAGTTGCA CTTCGGTCAT CGTGGCGGCA ACCAACCGGT GCGTTTCAGC 
GATACTATGC GGGTGGAGAT TTCCAGCCAT AACCACGGCT TTGCGGTCGA TGCGTCGTCG 
TTGCCGGAGG GAGTTGAGAT TACGCACATC AACCTGAACG ATGGGTGCGT CGAAGGGTTA 
CGCGCGCCGG ATCAACGCGC TTTCAGCGTG CAGTATCATC CCGAAGCCGC GCCGGGACCG 
CACGATGCGC GCTATCTGTT TCGCCGGTTT GTCGAACTGA TGGAGCAGGC GCGAAACCAG 
CGTTCAATGT CGAGCGGTTG A

Protein sequence

MTTRTYAMLA LEDGTIWHGY ALGAIGERTG EVVFNTSMTG YQEVLTDPSY YGQIVVMTAP 
HIGNTGVNRE DEESRHPWVA GFVVRAASPY VSNWRAAQSL HEYLAEHGIV AMTGVDTRAL 
VRHIRTQGAM RAVISSENPE PDRLIAAARA APSMNGLDLV PYVTCAEPYH WVEGNPGEWG 
PGETPAQRGE STFHVVAYDF GIKRNILRLL AEHGCRVTVV PATMPAADVL ALEPDGVFLS 
NGPGDPAAVT YGVQAVRDLL GKTPVFGICL GHQILGLALG GTTYKLHFGH RGGNQPVRFS 
DTMRVEISSH NHGFAVDASS LPEGVEITHI NLNDGCVEGL RAPDQRAFSV QYHPEAAPGP 
HDARYLFRRF VELMEQARNQ RSMSSG