Gene Rcas_4300 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4300
Symbol
ID	5541811
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5547415
End bp	5548524
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	58%
IMG OID	640896406
Product	phosphate binding protein
Protein accession	YP_001434344
Protein GI	156744215
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0226] ABC-type phosphate transport system, periplasmic component
TIGRFAM ID	[TIGR02136] phosphate binding protein

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTCAGCA GGCTTTATCG CGGCACTGTG CTTTCAATTG CCCTGCTTCT CTCGGCGTGC 
ACCGGGGCCG CTGCACCATC TCCCACGCCC ACGCCGTCCC CTGCGCCGAC TGCCGCACCA 
AGCGCCACTC CGCAGATCGT CTCTATTCAG CCAACCGCAA CGCCTTTTCC TGAGTCGATG 
ACGCGCCTCG ATCTGAGTGG CGAGATTATT ATCGACGGCT CAAGCACCGT GTACCCGATC 
ACCGAACTTG CGATGCAACA GTTCGCAGCG GTGGCGCCAC GGGTGACTAT TCAACTCGGA 
GTCAGCGGCA CCGGCGGCGG GTTCAAGAAA TTCTGTGCAG GCATTACCGA CATCTCGAAC 
GCTTCACGAC CGATTAAGCC GGACGAGAGC GACACCTGCC GCGCCAATGG CATCGCGTTC 
GTCGAAATAC CGGTTGCTTT CGATGGCATC TCGGTGATCA TCAATCGAGA CAACACATGG 
GCGCAGTGCA TGACCGTCGA TGATCTGAAA CGGATGTGGG CGCCCGAGTC GGAAGGAAGC 
GTGACCACAT GGCGGCAAAT ACGCTCCGAC TGGCCCGATC AACCGTTCAA ACTGTACGCG 
CCAGGGGTTG ACTCCGGAAC ACACGACTAC TTCACTGCGG CGATCGTTGG CAAGGAAGAT 
GCCAGTCGCA ATGATTATAT CGGCAGCGAA GACGATTATG TGCTCATGCA GCGCGTCATC 
GAAGATGCGC AGGGGATTGC GTATGTCGGA TACGCCTACT ACCAGGAGTA TGCCGACAAA 
GTCGGCGTAG TAGCCGTCGA TGCAGGGCAG GGGTGCGTAT CGCCCTCACT CACCACGATC 
ACGGAAGGCA CATATACACC ACTATCACGT CCATTGTTCA TTTATGTGCG CGCTGATCGT 
CTCGACCGAC CGGCGATGCT GGCATTCGTT GAATTCTATA TCAACCGCGC AGAACAACTG 
GTTCAAGATG CGCGCTACAT CCCGTTGCCG CAGCGCGCCT ATGAACTGGT GCAGCAGCGC 
GTTGACAGGC GGGTGACAGG TTCAATCTTC GACAAGCCGG TGCCGGTTGG CGTTTCAATC 
GATGAGTTGC TGATGCTGGA GGGGCAGTGA

Protein sequence

MFSRLYRGTV LSIALLLSAC TGAAAPSPTP TPSPAPTAAP SATPQIVSIQ PTATPFPESM 
TRLDLSGEII IDGSSTVYPI TELAMQQFAA VAPRVTIQLG VSGTGGGFKK FCAGITDISN 
ASRPIKPDES DTCRANGIAF VEIPVAFDGI SVIINRDNTW AQCMTVDDLK RMWAPESEGS 
VTTWRQIRSD WPDQPFKLYA PGVDSGTHDY FTAAIVGKED ASRNDYIGSE DDYVLMQRVI 
EDAQGIAYVG YAYYQEYADK VGVVAVDAGQ GCVSPSLTTI TEGTYTPLSR PLFIYVRADR 
LDRPAMLAFV EFYINRAEQL VQDARYIPLP QRAYELVQQR VDRRVTGSIF DKPVPVGVSI 
DELLMLEGQ