Gene Rcas_2804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2804
Symbol
ID	5540291
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	3625709
End bp	3627046
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	64%
IMG OID	640894931
Product	dehydrogenase catalytic domain-containing protein
Protein accession	YP_001432893
Protein GI	156742764
COG category	[C] Energy production and conversion
COG ID	[COG0508] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide acyltransferase (E2) component, and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGTTG ATATCGTTCT TCCACAGATC GGCGAAAGTA TGACCGAAGC CACGATCGGG 
CGCTGGCTCA AGCGTGTCGG CGACCGCATC GAACGCTTCG AGGCATTGGT GGAAGTCGAG 
ACGGATAAAG TCTCGACCGA AGTGACCTCG ATTGCCAGTG GCATTTTGCT CGAAATCGTG 
ACGCCTGAAG GCGCCACAGT GCCGGTTGGC ACGCTTCTGG CGCGTATCGG CGAGACGGCG 
GAGAGGCATG TGAGCGCAGC GCCAGCGCCG TCGCAGGAGA CAACGGCAGC GCCAGAACCT 
GTGCGCATCC GCCGCGGCGA TGGTCCGCCG ATCACGCCGG TGGTGGCGCG TCTGGCTGCT 
GAATATGGTA TCGACCTGAG CCAAATCCGT GGCACCGGCG CCGGCGGGCG CGTCAGCAAG 
AAGGATGTGT TGCGCTACAT CGAGATGCAG AAAGCGGCTG CCGCTTTGCT GCCCGGCGCA 
CCCACTGCGC CGCCTCCGGC GCCCGAAGCG CCTCCCATCC CATCTGTTTC CACAGCGCCA 
TCACCCCCTC TAGCGCGCGA AACGCCTTCT ACTGCGCCTG TTGCCGAAGC GCCGCCTGCC 
CTGCCCACAG CGCAGCGCCC TCCAATCACG CAACCGTTGC CCGACGAGGC GATCCTCACG 
CCATTGACCA CGATGCGACG CATGATCGCC GATCATATGG TCCGCTCCCT GCGCGACGCC 
CCGCAGGCCA CGACGGTCTT TGAGGTCGAT ATGGGGCGCG TGCTGGCGCA CCGCGACCGG 
TATCGCGCCT CTTTTGAACA GCAAGGGATA CGGTTGACTC TGACAGCGTA TGTGGTTCAG 
GCGGTTGCGA CTGCGCTGCG CCGCGTTCCG GCATTGAACA CGCGCTTCAC TGACGAAGGG 
ATCATCACAT ACCGGCGGAT CAACATTGGG GTGGCGGTCG CCCTCGACGA CGGATTGATC 
GTGCCGGTGC TGCGTGACGC CGACGAGAAA AGTCTGGCCG GCATCGCGCG CGCGTTGAAC 
GACCTGACGG AGCGCGCCCG CGCGCGCCGC CTGCAACCGG ACGACACCGA AGGGGGAACG 
TTTACCATCT CGAACCATGG CGTTGGCGGC AGTCTGTTCG CCACGCCGAT CCTCAACCGT 
GGACAGAGCG GTATTCTTGG CGTCGGCGCC GTGGTGAAGC GCGCGGTCGT TGTGACCCAT 
CAGGGGAATG ATGCGATTGT CATTCGCCCG ATGTGCTACC TGTCGTTGAC ATTCGACCAC 
CGCGCCTGTG ATGGCGCGAC CGCCGACGCA TTTCTGGCAG CGGTCAAAGA GGTTCTGGAA 
ACCTACCCCG AGCAATAA

Protein sequence

MAVDIVLPQI GESMTEATIG RWLKRVGDRI ERFEALVEVE TDKVSTEVTS IASGILLEIV 
TPEGATVPVG TLLARIGETA ERHVSAAPAP SQETTAAPEP VRIRRGDGPP ITPVVARLAA 
EYGIDLSQIR GTGAGGRVSK KDVLRYIEMQ KAAAALLPGA PTAPPPAPEA PPIPSVSTAP 
SPPLARETPS TAPVAEAPPA LPTAQRPPIT QPLPDEAILT PLTTMRRMIA DHMVRSLRDA 
PQATTVFEVD MGRVLAHRDR YRASFEQQGI RLTLTAYVVQ AVATALRRVP ALNTRFTDEG 
IITYRRINIG VAVALDDGLI VPVLRDADEK SLAGIARALN DLTERARARR LQPDDTEGGT 
FTISNHGVGG SLFATPILNR GQSGILGVGA VVKRAVVVTH QGNDAIVIRP MCYLSLTFDH 
RACDGATADA FLAAVKEVLE TYPEQ