Gene Saro_3594 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3594
Symbol
ID	5077743
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	+
Start bp	217425
End bp	218588
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	64%
IMG OID	640481318
Product	luciferase family protein
Protein accession	YP_001165980
Protein GI	146275820
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.335123
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTTCT CGATCATCTA CGAAGCGCAA ATGGTGGATA CCAGCCGCGA TAACGAGCAG 
GCGGTGTTCC TGCAGATCGT CGAGCAGGCC AAGTACGCCG AGGAAATGGG CTTCGACTGC 
ATCTGGTGCG TGGAGCATAC CGCGCTGACC CAGTATGCCC ACATGTCGGC TCCGGAAACG 
GTGCTGGCGT TCATCGCTGG CGCGACCAGC CGCATACACG TCGGCCACGG CGTGGTCTGC 
CTGCCGCCGG CAATGAACCA TCCGGTCAAG GTGGCGGAAC GCATCGCCAC GCTCGACATC 
CTCTCCAAGG GCCGTCTCCA CTTCGGCGTC GGCAAGGGCG GCACGCAGCA GGAAGCCGGC 
ACGTTCGGCT ATGACCTGGC CGAACTCCAG CCGATGATCG ACGAATCGAT GTACCTGATC 
CCCAAGATCA TGGTGCAGGA CGAGATCGAG CACGACGGCC AGTACATCAA GATCCCCAAG 
CGCCCGATCC ACCCCAAGCC GTTCCAGGAC CCGCATCCGC CGATGTACAT GGCCTGCACG 
CGCGAGAACA CGCTGATCGC CGCCGGCAGC CGCGGCATCG GCGCGCTGGT TCTGGGGTTT 
TCCGGCCCCG AGGAGATCGC CAAGAAGAAC GCGATCTATC GCGAGGCCTT CCGCACCCGC 
AAGGCCGAGG ACCAGGTCGG CTTCCGTCCG ACCGAACACC TCGCCGCGCT CTGCGCCGCG 
ACCGTCCTCG ATGACCGCGA GAAGGCGCGC AAGGTCGGCC TGCGCGGCCA GCGCTTCTTC 
GCCGAAAGCA TCGCCTACTG GTATCAGGGC GGCCCCAAGC CGACTGTGGA CGACAACCTT 
TCCGCCGAAG ATCACGCCAA GGTGCTGGAA CAGGGCAAGC AGGCGACCAT CGCCTATCTG 
TCGGAAGAGG CGATTCCGGT CGGTGACGAG CATCTGTCAA ACTACACCGT CGCGCAGGAC 
GCCTATGGCA CGCCGGACGA CTGCATCCGC TATGTCCAGC GGCTGAAGGA TGCGGGCGCG 
GACGAGATCC TCTTCATCTT CCAGATGGGC GGCATCCCGC ACGACATCAT CATGGAATCG 
ATCCGCAACA TCGGTGAAAA GGTCATCCCG CACTTCCGCG CGCTCGAGGC GGCCGAAGCG 
GCGGCGCTGG AACCGGCCGA GTAA

Protein sequence

MKFSIIYEAQ MVDTSRDNEQ AVFLQIVEQA KYAEEMGFDC IWCVEHTALT QYAHMSAPET 
VLAFIAGATS RIHVGHGVVC LPPAMNHPVK VAERIATLDI LSKGRLHFGV GKGGTQQEAG 
TFGYDLAELQ PMIDESMYLI PKIMVQDEIE HDGQYIKIPK RPIHPKPFQD PHPPMYMACT 
RENTLIAAGS RGIGALVLGF SGPEEIAKKN AIYREAFRTR KAEDQVGFRP TEHLAALCAA 
TVLDDREKAR KVGLRGQRFF AESIAYWYQG GPKPTVDDNL SAEDHAKVLE QGKQATIAYL 
SEEAIPVGDE HLSNYTVAQD AYGTPDDCIR YVQRLKDAGA DEILFIFQMG GIPHDIIMES 
IRNIGEKVIP HFRALEAAEA AALEPAE