Gene Rcas_2203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2203
Symbol
ID	5539684
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2844642
End bp	2845769
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	61%
IMG OID	640894336
Product	oxidoreductase domain-containing protein
Protein accession	YP_001432304
Protein GI	156742175
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.345355
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.953856
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGACC ACTCCAATCC TCCCGGTCTG CGCTTCGGTA TCATTGGCAG CGCTGCTGGA 
ATCGCCGAAA GCCATCTGAA AGCGCTTACC GAACTTCCAG GGGCGACGAT TGTTGGCATG 
GCAGACATCG CCATCGAACG CGGCGAGGCG CGCGCCAGAG CAGTCGGTTG CCCATTCTTC 
GCCGATCACC GCGCAATGCT CGACGCTGTG CGCCCTGATG TCGCCGTTAT CTGTGCGCCA 
CACCCACTGC ATGCCGCGTT GGCGATTGAT TGCCTGGACG CCGGCGCCCA CGTGCTGGTC 
GAAAAACCGC TGGCGGTCAG CGTCTCCGAA GCGGATGCAA TGATCGCCGC CGCAGACCGC 
GCCGGACGCT TGCTGGCAGT CTGTTTCCAG CAACGGTTTC GCCCGGTCAT CGAACATGCC 
CGCACCCTGA TCGAATCCGG CGCAATTGGC GATATTGTGC GCGTACTCTG CGTCGAACCC 
TGGTTTCGCA CCCAGTTTTA CTACGACTCG GCAGCCTGGC GCGGCACATG GCGCGGGGAA 
GGCGGCGGGG TCTTGATGAA TCAGGGACCT CACCCGCTCG ATCTGCTCTG CCACCTGACC 
GGTTCTCCGG CAAAGGTCTG GGGATGGGTG CGCACGATGG GGCACACGAT CGAGTGCGAG 
GATGTTGCGC AAGCATTGCT GGAATATCCC AACGGCGCGC CCGGCTATAT CTATTTCAGC 
ACGGTCGAAG CAGGTTCCGA ACGTCGCATG GAGATCGTCG GCGACTGTGG CGCGCTCGTG 
ATTGTCTTTG ATAACCTGAC GATCCATCGC TTCGCCGTAC CGCTGAGTGA GTATCGCACA 
ACGGTGCGCG AGATGTGGAG TCAACCACAG GTTCAAACCG AGACGCTCCG ACTGCCCAGT 
GATATTGGCG AACATGGCGG ACACCTTGGG GTCTATCTTG ATCTGGTGCG GGCGATTGCT 
GAAGGGCGTC GTCCGCGTTG CGACGCGCGC GAGGCGCGCA TATCACTTGA ACTGTCGAAC 
GCGATCATCT ACTCCGGTAT GACCGGTCAA CCGGTGACGC TTCCGCTTGA CCGTCAGGCG 
TATGATGCGT TGCTCGACGA TCTGAGAGCG GGAAGGAGAA AGTTGTGA

Protein sequence

MTDHSNPPGL RFGIIGSAAG IAESHLKALT ELPGATIVGM ADIAIERGEA RARAVGCPFF 
ADHRAMLDAV RPDVAVICAP HPLHAALAID CLDAGAHVLV EKPLAVSVSE ADAMIAAADR 
AGRLLAVCFQ QRFRPVIEHA RTLIESGAIG DIVRVLCVEP WFRTQFYYDS AAWRGTWRGE 
GGGVLMNQGP HPLDLLCHLT GSPAKVWGWV RTMGHTIECE DVAQALLEYP NGAPGYIYFS 
TVEAGSERRM EIVGDCGALV IVFDNLTIHR FAVPLSEYRT TVREMWSQPQ VQTETLRLPS 
DIGEHGGHLG VYLDLVRAIA EGRRPRCDAR EARISLELSN AIIYSGMTGQ PVTLPLDRQA 
YDALLDDLRA GRRKL