Gene Sare_2798 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2798
Symbol
ID	5706154
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	3177791
End bp	3178816
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	70%
IMG OID	641272254
Product	luciferase family protein
Protein accession	YP_001537624
Protein GI	159038371
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03559] probable F420-dependent oxidoreductase, Rv3520c family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000196172
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAAGCTTG GCTACACCAC CGGCTATTGG TCCGCCGGAC CGCCCGAGGG CGTCACAGCT 
GCCATCGCGG AGGCCGACCG GCTCGGCTTC GACTCGATCT GGGCCGCCGA GGCGTACGGG 
TCGGACTGCC TGACCCCACT CGCCTGGTGG GGAGCCAACA CCTCCCGCGT CCGGCTGGGC 
ACCAACATCA TGCAGATGGC GGCCCGCACC CCGACCGCCG CGGCGATGGC CGCGCTCACC 
CTCGACCACC TCTCGGGCGG CCGGTTCATC CTCGGGCTCG GTGCCTCCGG CCCACAGGTC 
GTCGAGGGGT GGTACGGCCA GCCGTACCCG CGACCGCTGG CCCGTACCCG GGAGTACATC 
GAGATCGTTC GTACCGTCCT CGCCCGTACC GGACCGGTCG AGCACGACGG AGCGTTCTTC 
CAACTCCCGT ACCTCGGCGG CACCGGCCTG GGTAAGCCGC TGAAGTCCAC CGTCCACCCG 
CTGCGCGCCG ACATCCCAAT CTTCCTCGCC GCCGAGGGGC CGAAGAACGT GGCCCTGGCC 
GCCGAGATCG CCGACGGCTG GCTGCCGTTG TTCTTCTCCC CCAAGGCGGA CAGTTTCTAC 
CGTGCCGCAC TCGCCGAGGG CTTCGCCCGG CCTGGTGCCC GCCGTGACAT GGACGCGTTC 
GAGGTCGCCG CGACCGTGCC GATCGTCGTC CACGACGACA TCGAGGCAGC CGCCGACCGG 
CTCCGGCCGT TCGTCGCGCT GTACGTGGGG GGCATGGGGG CCAAGTCGGC CAACTTCCAC 
CGCGACGTCA TCGCCCGCCT CGGGTACGAA CGAGACTGTG ACGTCATCAC CGAGGCATAC 
CTGGCAGGTG ACAAAAGGGG GGCTGCCGCC GCCGTACCGA CCGCGCTGGT GGAGGACATC 
GCGCTGATCG GCCCGGTCGC CAAGGTCAGG GACGAGTTGC AGGGATGGCG CGAGAGTGTG 
GTCACCACCC TGCTCGTCCA GGGCAACTCC CGGCAGCTAC GCCAGATCGC CGAGTTGATG 
AGCTGA

Protein sequence

MKLGYTTGYW SAGPPEGVTA AIAEADRLGF DSIWAAEAYG SDCLTPLAWW GANTSRVRLG 
TNIMQMAART PTAAAMAALT LDHLSGGRFI LGLGASGPQV VEGWYGQPYP RPLARTREYI 
EIVRTVLART GPVEHDGAFF QLPYLGGTGL GKPLKSTVHP LRADIPIFLA AEGPKNVALA 
AEIADGWLPL FFSPKADSFY RAALAEGFAR PGARRDMDAF EVAATVPIVV HDDIEAAADR 
LRPFVALYVG GMGAKSANFH RDVIARLGYE RDCDVITEAY LAGDKRGAAA AVPTALVEDI 
ALIGPVAKVR DELQGWRESV VTTLLVQGNS RQLRQIAELM S