Gene Rcas_1380 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1380
Symbol
ID	5538853
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	1765543
End bp	1766652
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	57%
IMG OID	640893518
Product	hypothetical protein
Protein accession	YP_001431494
Protein GI	156741365
COG category	[S] Function unknown
COG ID	[COG2718] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02877] sporulation protein YhbH

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGATTC ACCGCGCTGA GCGTGATTTG AACCGGTTCC GCCAGATTGT ACGCGGCAAG 
ATCAAAAAAG ACCTGCGCAA GTACATGTCG CAGGGCGAAA TGATTGGACG CCAGGGGCGC 
AAATATGTGT CGATCCCGCT GCCGCAGATC GATCTGCCGC AGTTCCGCTA TGGCACACGC 
CAGAGTGGCG GGGTTGGGCA GGGCGATGGC AACGTTGGCG ACCCAATTGG GCAGGGTGAT 
GGCCAGTCGG GGCAGGGCGA GGCTGGCTCG GAACCAGGGC AGCACGTGAT CGAGGTCGAT 
GTTACCATCG AAGAATTGGC GCAAATCCTT GGCGAAGAAC TGCAATTGCC CAACATCCAG 
CCCAAGGGCA AAAAGAATAT TGTCTCGCAG AAGGATCGGT ATTCCGGCAT TCGCCGTGTT 
GGTCCCGACT CGCTGCGGCA TTTCAAACGC ACCTATCGCG AAGCGCTCAA ACGCCAGATT 
TCGTCGGGTG AGTACAACCT CGCCGATCCG ATCGTCGTGC CGATCCGCCA GGATATGCGC 
TATCGCTCCT GGAAGGAAAC GCTTCAGCCA GAGTCGAACG CGGTCATTAT CTACATGATG 
GACGTGAGCG GCTCGATGGG CGCTGAGCAA AAGGAGTTGG TGCGCATCAC GGCATTCTGG 
ATTGAAACCT GGCTGCGCTC GCAGTACAAG GCGATCGATA TTCGCTATAT CGTTCACGAT 
GCTGCTGCAA AAGAGGTCGA TCAGGAGACG TTCTACCACA TCCGCGAAGG CGGCGGCACC 
AAGATCAGTT CGGCGTACAA ATTGTGCAAT AAACTGATCG ATGAGCGCTA CCCGGCTGAT 
GAGTGGAATA TCTATCCGTT CCACTTCTCC GATGGCGACA ACTGGGGTGG CGGCGATACG 
CGCGAGTGCA TCGAATTGCT GCGCACCCAA CTTCTTCCCA AGGTCAATCA GTTCTGCTAT 
GGTCAGGTGC GTTCGCTCTA CGGCTCGGGG CGCTTTGCGC ACGACCTCGA AGAGCACCTG 
GGCAAGCATG AGGCGCTGGT GATCTCGGAG ATTGCCGATC GCGACGATAT CTACGATGCG 
ATCAAGGATT TTCTTGGCAA GGGTCGGTAG

Protein sequence

MSIHRAERDL NRFRQIVRGK IKKDLRKYMS QGEMIGRQGR KYVSIPLPQI DLPQFRYGTR 
QSGGVGQGDG NVGDPIGQGD GQSGQGEAGS EPGQHVIEVD VTIEELAQIL GEELQLPNIQ 
PKGKKNIVSQ KDRYSGIRRV GPDSLRHFKR TYREALKRQI SSGEYNLADP IVVPIRQDMR 
YRSWKETLQP ESNAVIIYMM DVSGSMGAEQ KELVRITAFW IETWLRSQYK AIDIRYIVHD 
AAAKEVDQET FYHIREGGGT KISSAYKLCN KLIDERYPAD EWNIYPFHFS DGDNWGGGDT 
RECIELLRTQ LLPKVNQFCY GQVRSLYGSG RFAHDLEEHL GKHEALVISE IADRDDIYDA 
IKDFLGKGR