Gene Rcas_1234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1234
Symbol
ID	5538703
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	1594635
End bp	1595879
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	62%
IMG OID	640893369
Product	ABC-type Fe3+ transport system periplasmic component-like protein
Protein accession	YP_001431349
Protein GI	156741220
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTGCCG AAACCAGAGA CTGGCGCCGA TCGCGCCGGG CTTTTCTGCG TGCAGCGGTT 
GGCGCCGGTG CAGGCGCCAT TCTTGCCGCC TGTGGCCAGG CTGCTCCAAC AGCCCCGGCA 
GCAACGACCG CTCCGGCTGC GACCACGGCG CCCGCAGCCG AAGCAACCGC ACCTGCCCAA 
CTCCCATCGC CGCCTGCACC TGGTCCATTG ACCGCTGCGG ATGCCGGCGG CATAGAGAAG 
TTGATCGAAC GGGCGCGCGC GGAAGGCAAC CTGTCCACCA TTGCGCTGCC GGACGATTGG 
GCAAACTATG GCGAGATGAA GCAGAAATTT CTCGAGAAGT ATCCCTTCAT CAAACACGAA 
GATCTCAATC CCGACGCCAG TTCCGCGCAG GAGATCGAGG CGATCAAAGC CAACGCTGGC 
AGCAAGGGCC CACAGGCGCC CGATGTAATC GATGTCGGGT TCACCTGGGG CGATACGGCA 
AAGAAAGAAG GTCTCCTCCA ACCTTACAAG GTTGAGAAGT GGGATGAAAT CCCGGAGACG 
CTGAAAGACC CCGAAGGGTT CTGGTATGCC GACTACTATG GCGTTATGGC GTTTGAAGTG 
AACACGCAGG TGGTTCAGAA CATCCCGCAG GACTGGTCGG ACCTGTTGAA GCCGGAGTAT 
AAGGGGCAGG TGGCGCTGGC AGGCGACCCG ACCGGTTCCG GGCAGGCGAT CAACGCGGTG 
TGGGCTGCGG CGCTCGGCAA CGGCGGCTCG CTCGACAATC CCATGCCGGG GCTGGAGTTC 
TTCAAGAAAC TGAACGAGGC GGGCAACCTG CTGCCGGTTG TCGCCAAACC TGCAACCATC 
GCCAAGGGCG AAACGCCCAT CGCGCTGCGC TGGGATTATA ATGCGCTGGC AAACCGCGAT 
CAGAACGCCG GGAATATCGA CATCGCCGTG GTTGTGCCGA AAAGCGGATC GCTAGCCGGC 
GTCTATGTGC AGGCGATCAG CGCCTATGCG CCACGCCCGC ACGCAGCCCG GCTCTGGATG 
GAGTTCCTCT ACTCCGATGA GGGTCAGTTG ATCTGGCTTA AGGGGTACGC GACGCCGGCG 
CGCTTCGAGG CAATGCGCAA AGCCGGGTTG ATCCCGCAGG ATTTACTCGA CAAATTGCCG 
AAGACCGATG CGCCTGTGGC GTTCCCAACC GGTGGTCAGA TCAATGCTGC CTTCGACATG 
ATCAAGAGCA ACTGGCCTAC GGTCGTTGGT GCAACGGTGC AGTAG

Protein sequence

MSAETRDWRR SRRAFLRAAV GAGAGAILAA CGQAAPTAPA ATTAPAATTA PAAEATAPAQ 
LPSPPAPGPL TAADAGGIEK LIERARAEGN LSTIALPDDW ANYGEMKQKF LEKYPFIKHE 
DLNPDASSAQ EIEAIKANAG SKGPQAPDVI DVGFTWGDTA KKEGLLQPYK VEKWDEIPET 
LKDPEGFWYA DYYGVMAFEV NTQVVQNIPQ DWSDLLKPEY KGQVALAGDP TGSGQAINAV 
WAAALGNGGS LDNPMPGLEF FKKLNEAGNL LPVVAKPATI AKGETPIALR WDYNALANRD 
QNAGNIDIAV VVPKSGSLAG VYVQAISAYA PRPHAARLWM EFLYSDEGQL IWLKGYATPA 
RFEAMRKAGL IPQDLLDKLP KTDAPVAFPT GGQINAAFDM IKSNWPTVVG ATVQ