Gene Rcas_3981 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3981
Symbol
ID	5541491
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5191970
End bp	5192959
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	57%
IMG OID	640896093
Product	luciferase family protein
Protein accession	YP_001434032
Protein GI	156743903
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03557] F420-dependent oxidoreductase, G6PDH family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0510411
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTAATCA TCGGATATGC CGCAGCCCTG GAACAGTTTC ATCCGAACGA TCTACTGGCA 
TACTGCCAGC TCGCCGAGCA ACATGGCTTC AAGGGAGTAA TGGCAGCGGA TCATTTTCAG 
CCGTGGGTGC CACAACAGGG GCACAGCGCC TTTGTCTGGA GTTGGATGGC CGCGCTCGGT 
GCAACAACGC GCACCCTGAC GTTCGGTCCG GGTGTGACCT GCCCATCGTT CCGATACCAT 
CCGGCGGTTG TGGCGCAGGC GGCTGCAACC CAGGCGGCGA TGACTCCCGG TCGTTTCTGG 
TTGGGGTTGG GCAGCGGCGA GGCGCTGAAT GAACATGTCG TGGGTGGTGT CTGGCCCGAA 
CCGCATATCC GTCTTCAGAT GCTTCAGGAA GCGGTCAGCA TTATTAAGAA ACTGTTCACC 
GGCAAAGTTG CCCGGCACGA CGATGGGAAA TACTTCAAAA TGGAGCGGGT TCGTCTCTGG 
ACATTGCCGC CGGATCCGCC ACCGATCTAC ATTGCGACGG CTGGACCGGT GACCGCCGAA 
TGGACCGGAA GAGCGTGCGA TGGGATTATC ACGCCTGGCG CCAGCCCCGA TAAATTGCGG 
ATGCTGCTAG GGAAATTCGA GGAGGGCGCG CGGAAAGCGG GGAAAGACCC TGCGCGAATG 
CCGAAACTGC TTCAGTTGCA CATGTCGTGG GCGGAAACCG CTGAAGAGGC TATGCAGAAC 
GCACTGACCG AATGGCCCAA CGGTGGCATG CCCTTCCCCA AGCAGGATAT TCGCAACCCG 
GAAGATTTCG CCGAAATTGC CAAACTGGTG CGACCAGAAC ACTTCAAGAA CCGGATGTTG 
ATCTCATCCG ATCTCGATGA ACATCGCGCA TACATTCAGC AGTTCATCGA TCTGGGATTT 
GACGAGATTC ATGTGCACAA CGTTGGTCGC AATCAGGAGC AGTTCATCAA AGCGTTCAGC 
GAACAGGTCA TTCCACGTCT CAAAGCATAA

Protein sequence

MVIIGYAAAL EQFHPNDLLA YCQLAEQHGF KGVMAADHFQ PWVPQQGHSA FVWSWMAALG 
ATTRTLTFGP GVTCPSFRYH PAVVAQAAAT QAAMTPGRFW LGLGSGEALN EHVVGGVWPE 
PHIRLQMLQE AVSIIKKLFT GKVARHDDGK YFKMERVRLW TLPPDPPPIY IATAGPVTAE 
WTGRACDGII TPGASPDKLR MLLGKFEEGA RKAGKDPARM PKLLQLHMSW AETAEEAMQN 
ALTEWPNGGM PFPKQDIRNP EDFAEIAKLV RPEHFKNRML ISSDLDEHRA YIQQFIDLGF 
DEIHVHNVGR NQEQFIKAFS EQVIPRLKA