Gene Rcas_0903 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0903
Symbol
ID	5538369
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	1182862
End bp	1183869
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	58%
IMG OID	640893053
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_001431036
Protein GI	156740907
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGATG CCATTCTGCG CGCAGAAGCG CTCCGGGCGT TTTATGCGCT CGATATCTAT 
GGTAAAACCA AAATCATCAA GGCGGTCCAC GATGTTGATC TGGCGATCCG GGAGAATGAG 
ATCTACGGCA TCGCCGGCGA GAGCGGCTGC GGTAAATCCA CGTTGCTCAA GGCGCTTGCG 
GCTGCCGTCG AGCCGCCATT GCGCATCATG GGCGGAAAGG TTTGCTATCG CGTCAATGGC 
GCCGAGATCG ATGTCGCGGC GCTTTCTCAG GAAGAGAAAC GCAGGCTGCG CATGACGTAT 
ATCGCGTATG TGCCACAGGG GTCGATGAGC GTGCTCAACC CGGTCGCGCG CATTCGCGAT 
ACGTACCGCG ACTTCATTGA AAGTCATCTG GACGTTCACC AGAAGAGCGA CGCCTTCATC 
CTCGCCAGAG ACCATCTGAT CGAGTTGGGA TTGCCGCCGA AAATCCTCGA TGCCTACCCG 
CATCAACTGT CGGGCGGTAT GCGGCAGCGT GTGACGATTG CGCTTGCGAC GTTGCTCAAG 
CCGCGTATCA TTATCGGCGA TGAACCAACC ACGGCGCTCG ATGTTGTCGT GCAGCGCGGG 
GTCGTGCAAT TGCTCAGGGA TGTGCAGTCC AGGCTGAAAA ATACCATTGT GCTGGTAACG 
CACGATATGG GGGTGCATGC CAATATTGCC GACCGCATCG GCATCATGTA TGCCGGGAGG 
ATCGTCGAGG AAGCGCCAAC CGAACGCATG TTCAGCGTGC CGACCCATCC ATACACACAG 
TATCTGATCA GTTCATTGCC CAGGTTTGGC GACAAAACGC CGCGTGAGAG CGTACCGGGA 
AGTCCGCCTT CACTCGCCAA TCCGCCCTCC GGCTGTCCGT TCCATCCCCG CTGTCCTCAC 
GCGATGGAGA TCTGCAAGCG CGAGATGCCG GGATTCACAC CGGTTGCGCC GGATCACAGG 
GTTGCCTGTT GGTTGGTCGA AGAGGGGAGT TATGGAAAAG CTGCTTGA

Protein sequence

MGDAILRAEA LRAFYALDIY GKTKIIKAVH DVDLAIRENE IYGIAGESGC GKSTLLKALA 
AAVEPPLRIM GGKVCYRVNG AEIDVAALSQ EEKRRLRMTY IAYVPQGSMS VLNPVARIRD 
TYRDFIESHL DVHQKSDAFI LARDHLIELG LPPKILDAYP HQLSGGMRQR VTIALATLLK 
PRIIIGDEPT TALDVVVQRG VVQLLRDVQS RLKNTIVLVT HDMGVHANIA DRIGIMYAGR 
IVEEAPTERM FSVPTHPYTQ YLISSLPRFG DKTPRESVPG SPPSLANPPS GCPFHPRCPH 
AMEICKREMP GFTPVAPDHR VACWLVEEGS YGKAA