Gene Rcas_3959 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3959
Symbol
ID	5541465
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5165861
End bp	5166889
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	61%
IMG OID	640896067
Product	luciferase family protein
Protein accession	YP_001434010
Protein GI	156743881
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03617] probable F420-dependent oxidoreductase, MSMEG_2256 family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.181743
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTCG ATGCAACGCT GGTGGTTGAT GCGCGCCGAC TCAACGAGGC GGGCAAAATT 
GCGCGCGCCG CCGAAGCCGT GGGGTTCGCT GCGCTCTGGA CGCCGGAAAC GCAGCATAAT 
CCCTTTTTGC CGCTGACGCT GGCAGCCGAT CATACTGCCG AGATTCATCT GGGGACGGCA 
GTGGCGATTG CGTTTGCGCG CAGCCCGATG GTGATGGCGC AGATCGCCTG GGACCTTCAG 
GCGTTCTCTG GGGGACGCTT TATCCTGGGG TTGGGGACGC AGGTGAAGGC GCACATCGAA 
CGGCGCTTCG GCATGACATG GGATCCGCCG GTTCCGAAAT TGCGTGATTA TATTCAGGCG 
CTGCGCGCAA TCTGGCAGGC ATTCCAGACT GGCGCCAAAC TCGATTATCG CGGTCAGTTC 
TACAACCATA CCCTCATGTC GCCCTTCTTT AACCCTGGTC CGATTGCCGA TCCCCACATT 
CCTGTTTATA TCGCCGGGGT CAACGAAGGA TTGGCGCGTC TGGCAGGCGA GTTGTGCGAC 
GGTTTTCACG TCCATCCCTT TCATAGTGTA AAGTATATTA ATGAGATTGT CCGACCGCAG 
GTGGCGGCCG GCGCGGCAAA GGCGGGACGC GATCCGTCGC AGGTGAATCT GACGAGCAGC 
GTGTTTCTCA TTACTGGTCC CGATGAGGCA AGTATGGAAG GTTCTCGCGC ATTTGTGCGC 
GAACAGATTG CGTTCTATGC CTCGACTCCA ACCTACCGCG TGGTGCTGGC ATGTCACGGC 
TGGGAGGACG TCGGCGAGCA GTTGTCGCGT CTGGCAGCCG CGCGGCGCTG GTCCGAAATG 
GGGGCGCTGA TTACCGACGA TATGCTCGAT GTGTTCGCCG TCACGGCGCC GCTTGATCGG 
ATCGGCAAGG CGCTGCGCGA ACGCTACGAC GGCGTCCTCG ACCGGGTCGG CAGTTACCTG 
CCGTACACGC CAGGCCCGCT CGACGATGCG TGGCGGCAGG CGGTGCGCGA TGTGAGCAGG 
GGGGAGTGA

Protein sequence

MKLDATLVVD ARRLNEAGKI ARAAEAVGFA ALWTPETQHN PFLPLTLAAD HTAEIHLGTA 
VAIAFARSPM VMAQIAWDLQ AFSGGRFILG LGTQVKAHIE RRFGMTWDPP VPKLRDYIQA 
LRAIWQAFQT GAKLDYRGQF YNHTLMSPFF NPGPIADPHI PVYIAGVNEG LARLAGELCD 
GFHVHPFHSV KYINEIVRPQ VAAGAAKAGR DPSQVNLTSS VFLITGPDEA SMEGSRAFVR 
EQIAFYASTP TYRVVLACHG WEDVGEQLSR LAAARRWSEM GALITDDMLD VFAVTAPLDR 
IGKALRERYD GVLDRVGSYL PYTPGPLDDA WRQAVRDVSR GE