Gene Rcas_2141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2141
Symbol
ID	5539621
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2751333
End bp	2752553
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	62%
IMG OID	640894275
Product	hypothetical protein
Protein accession	YP_001432244
Protein GI	156742115
COG category	[S] Function unknown
COG ID	[COG3214] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.129516
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.124247
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACTGA CGCTGACTCC CAATGCGATT CGTCCGTTGC TGCTGACCGT CCAGGGTCTC 
GACCGCCCAA AGAAACACCC GGCGACCAAA GACTCGGTTC TGGCAGCGAT GCAGCGGATG 
AAGGCGCTTC AGATCGATAC GATCCATGTG GTCGCGCGTA GTCCATATCT GGTGTTATGG 
AGCCGTCTTG GCGCATATGA GCCACGCTGG TTGACCGATC TGCTGGCGGA GCGGGCCATC 
TTCGAATACT GGTCGCACGA GGCATGCTTT TTGCCCATCG AGGATTACCC GGCCTACCGC 
TCGTTGATGC TGGCGGGGCA GACGCGCAGC AACACCTATG CGCGCCGGTG GCTGCACGAG 
AACCGGACGA TTGCCGCAGC GTTGATGGAT CATATTCGCA ACAACGGACC GGTTCGCTCA 
GCCGAATTCG CCCGTACAGA CGGCACGAGG GGAGGATGGT GGAACTGGAA GGTCGAAAAG 
ATGGCGCTAG AAATGCTCTT CATCGTTGGC GATCTGATGA TCGACCGGCG TGAGCATTTT 
CAGCGCCTCT ACGACCTACG CGAGCGAGTT TTGCCCGCAT GGGACGATAC CTGTGCACCC 
GATGTGGAGG TAGCGCAGCG CACCCTGATC CTCGCAGCAG CACAGGCGCT CGGTGCAGCG 
CCGGCGCGCT GGCTGGCAGA TTACTTTCGC ACCGGCAAGG CGGAAACGGC GCGCATTGCC 
GCTGCTCTGG CAGCCGAAGG CGCCCTTGCG ATAGCGCATG TCGCAGGATG GCGCGAGCCG 
GTCTACATTC ATCCACATCG CCTGCCGCTG GCGCAGGCTG CCGCCGATGG GGCGCTCCAA 
TCAACAGTCA CCACGTTGCT TTCGCCATTC GATCCGGTCG TATGGGATCG GCGACGGGCG 
CTGGAATTGT TTGGCTTCGA CTATCGCATC GAATGTTATA CTCCTGCATC CAAACGACGG 
TATGGCTATT TTACGCTGCC CATCCTGCAC CGGGGGGCGC TGGTCGGGCG GCTCGACCCG 
AAAGCGCACC GCAAAGACGG CATCTTCGAG GTCAAGGCGC TCTACCTCGA ACCAGGCGTC 
GATCCCGACG AAGACCTGGC GATCAATCTG GCAGAGGCGT TGCGCTCCTG CGCCGTATGG 
CACGGCACGC CGGAGGTCGT CGTCCGGTTC TGCGATCCGC CGGCGTTTGG CGCGTTGTTG 
AAGCGCGCCT TGCGTCTCTG A

Protein sequence

MPLTLTPNAI RPLLLTVQGL DRPKKHPATK DSVLAAMQRM KALQIDTIHV VARSPYLVLW 
SRLGAYEPRW LTDLLAERAI FEYWSHEACF LPIEDYPAYR SLMLAGQTRS NTYARRWLHE 
NRTIAAALMD HIRNNGPVRS AEFARTDGTR GGWWNWKVEK MALEMLFIVG DLMIDRREHF 
QRLYDLRERV LPAWDDTCAP DVEVAQRTLI LAAAQALGAA PARWLADYFR TGKAETARIA 
AALAAEGALA IAHVAGWREP VYIHPHRLPL AQAAADGALQ STVTTLLSPF DPVVWDRRRA 
LELFGFDYRI ECYTPASKRR YGYFTLPILH RGALVGRLDP KAHRKDGIFE VKALYLEPGV 
DPDEDLAINL AEALRSCAVW HGTPEVVVRF CDPPAFGALL KRALRL