Gene Rcas_3597 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3597
Symbol
ID	5541098
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	4695542
End bp	4696570
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	62%
IMG OID	640895716
Product	electron transfer flavoprotein alpha subunit
Protein accession	YP_001433664
Protein GI	156743535
COG category	[C] Energy production and conversion
COG ID	[COG2025] Electron transfer flavoprotein, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCTG AACAGCCAAC CATTCCGCGC ATCTGGGTGT TCGTCGAGCA ACAGGAACAT 
CAGGTGCATC CGGTATCGTG GGAATTGCTC GGCGCGGCGA AGCGGCTGTC GGCGGATCTG 
CCGGGCAGCG TGGTCGAAGC GGTGCTGCCA GGACATCAGG TTGCCGATCT GGCGCCACAG 
GCGTTTCAGT ATGGCGCAGC ACGCATCTAT CTGATCGATA ATCCAGTGCT GGAGATCTAC 
CGCAACCTGC CGTATGCCGT TGCTGTCAGC CAGCTGGTGA AGGAGCATCG TCCGGAGATT 
TTCCTGATCG GCGCAACGAC GCTTGGGCGC GACCTGGCAG GCTCAATTGC CACGCGCGTC 
GGCACCGGTC TGACTGCCGA CTGCACCGAA CTCTCAATCG ATCCCGCCAA CCATATTCTG 
GCAGCCACCC GTCCGACATT CGGCGGCAAC CTGATGGCGA CAATCCTCTG CCGCCGCCAC 
CGACCGCAGA TGGCGACTGT TCGCCCACGG GTGCTGCCAA TGCCGGACCC CGCACCGGAC 
GCGACCGGCG AAGTAGTGAC CGTTCCGTTC GATATGCGCG AGGAGGACGT TCCGGTCAAA 
CGATTGCGGT TGATCCGCGC CGAAGAGCAA CCCAACATTG AGTATGCCGA AGTGATCGTC 
GCCGGTGGAC GTGGTATGGG GGGACCGGAG GGATTTGCGC TCCTCCAGGA ATTGGCAGAC 
GCACTCGGCG GCATGGTTGC AGCCAGCCGT CCGGTGGTGG ACGCCGGATG GATGGACGCC 
AGCCGGCAGG TGGGACAAAC GGGCAAAACG GTGCGTCCCA AGTTGTACAT TGCGGCGGGA 
ATCTCCGGCG CAGTGCAGCA TCGGGTCGGC ATGAGCGGCG CTGATGTCAT TCTGGCAATC 
AACACCGATC CAAACGCGCC GATCTTCCAG ATCGCTACGA TGGGGATCGT CGGCGATCTG 
TACGAAGTGA TCCCCGCGTT GATACGTCAG GTGAAAGGAC AGTCGTATGA CGGGCAGGCT 
CACCTTTGA

Protein sequence

MNAEQPTIPR IWVFVEQQEH QVHPVSWELL GAAKRLSADL PGSVVEAVLP GHQVADLAPQ 
AFQYGAARIY LIDNPVLEIY RNLPYAVAVS QLVKEHRPEI FLIGATTLGR DLAGSIATRV 
GTGLTADCTE LSIDPANHIL AATRPTFGGN LMATILCRRH RPQMATVRPR VLPMPDPAPD 
ATGEVVTVPF DMREEDVPVK RLRLIRAEEQ PNIEYAEVIV AGGRGMGGPE GFALLQELAD 
ALGGMVAASR PVVDAGWMDA SRQVGQTGKT VRPKLYIAAG ISGAVQHRVG MSGADVILAI 
NTDPNAPIFQ IATMGIVGDL YEVIPALIRQ VKGQSYDGQA HL