Gene Rcas_4372 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4372
Symbol
ID	5541885
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	5625565
End bp	5626653
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	62%
IMG OID	640896478
Product	periplasmic binding protein
Protein accession	YP_001434414
Protein GI	156744285
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4558] ABC-type hemin transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.670262
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTCCA GCCATCATGA GCGCCACGCG GCGTCGGTCG GTCGGTTGCG TCGGATGCTT 
CTTGGGTTCA GCCTGGCTGT CGTGGCGTTG CTCGCTGCAT GCGGGACGCC GTCGCCTTCC 
GGTGTGATTC CTCCCGCAGC CACGAGAGTT CCCGCCTCTT CATCGCTCCC AACACCTGCA 
TCCACGAGTG TGCCGGGGAT CGTCGAGTCT GTTCCAGGCG AGGCAGAACC GCAACTTCCG 
GCCACCGTCG TCGATTATCA GGGCGAGCAG GTGACGATTA CGTCCATCGA ACGGATCGTC 
AGTCTGAACG GCGATGTGAC CGAAATCATT TTTGCGCTTG GGATGGGGGA TCATGTCGTC 
GGCGTCGATA GCAGTGCCAC ATTTCCTCCC GAACGCACCA AAATGCTGCC AAACATCGGC 
TATCAACGGC GATTGAGCGC CGAAGGAATC CTGGCGCTCA ATCCGACGCT GGTGATCGGC 
GATGAGGCGG CCGGTCCGCC CGAAACGCTG GCGCAGATCC GCACCGCAGG CGTGCCGGTG 
GCGATCACTG CCGATCCGCC AACGCTCGAT GCACCGGTGC AGAAAATTCG GTTTGTCGCG 
CAGGCGCTCG GCATTCCGCA GCGCGGCGAA CGCCTTGCCG CGCAGGTCGA AGCCGAGATC 
GCGCGCGCGC GCGACCTGGC GAGTCGAATA ACGAACCCGC CGCATGTCCT CTTTCTCTAT 
CTGCGCGGCA CGGATGTTCA GCAGGTCGCC GGCAGTAAAA CGCCGGTCAA TGTGATGATC 
ACTGCCGCCG GCGGACTCAA TGCAGGTGCG GAAGCCGGGA TTGTGGAGTT CAAACCGTTG 
AGTCCCGAAG TGGTCATTGC TGCGCAACCC GATGTGATTC TAGTGCTGGA AAAAGGGCTG 
GAGTCAGTTG GCGGCGTCGA TGGTCTGCTG ACCATCCCCG GTCTCGCTGA CACGCCGGCC 
GGGAAACAGC GTCGGATCAT TGCATTCGAT GATCTCTACC TGCTCGGCAT GGGTCCGCGC 
ACCGGCCAGG CGCTCGCCGA TCTCGCCATC GCATTGTATG AGACTTCATC ACAGGAGAAG 
CATCCATGA

Protein sequence

MTSSHHERHA ASVGRLRRML LGFSLAVVAL LAACGTPSPS GVIPPAATRV PASSSLPTPA 
STSVPGIVES VPGEAEPQLP ATVVDYQGEQ VTITSIERIV SLNGDVTEII FALGMGDHVV 
GVDSSATFPP ERTKMLPNIG YQRRLSAEGI LALNPTLVIG DEAAGPPETL AQIRTAGVPV 
AITADPPTLD APVQKIRFVA QALGIPQRGE RLAAQVEAEI ARARDLASRI TNPPHVLFLY 
LRGTDVQQVA GSKTPVNVMI TAAGGLNAGA EAGIVEFKPL SPEVVIAAQP DVILVLEKGL 
ESVGGVDGLL TIPGLADTPA GKQRRIIAFD DLYLLGMGPR TGQALADLAI ALYETSSQEK 
HP