Gene Arth_2551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2551
Symbol
ID	4444877
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	2864271
End bp	2865395
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	65%
IMG OID	639690370
Product	luciferase family protein
Protein accession	YP_832030
Protein GI	116671097
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.726432
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGATCG GCGTATTCAG CGTCAGTGAC ATCACCACTG ATCCCACCAC GGGGCGCACA 
CCCACGGAAC ACGAGCGCAT CAAAGCGTCA GTGGCGATTG CCAAGAAGGT CGAAGAGATC 
GGTATGGACG TCTACGCCAT TGGCGAGCAC CACAACCGCC CCTTCTTCTC CTCCTCCCCC 
ACCACCACAC TGGCCTACAT CGCGGCGCAG ACGGAACGAA TCATCCTGTC CACCGCCACC 
ACGCTGATCA CCACCAATGA CCCGGTGAAG ATCGCCGAGG ACTTCGCGAT GCTGCAGCAC 
CTGGCGGACG GCCGCGTGGA CCTGGTGATG GGCCGCGGCA ACACGGCCCC GGTCTACCCG 
TGGTTCGGCA AGAACATCCA GGACGGCATC GAACTGGCCA TCGAGAACTA CAGCCTGCTG 
CGCCGGCTCT GGGACGAGGA CACCGTGAAC TGGTCCGGCA AGCACCGCAC GCCGCTGCAG 
AACTTCACCT CAACCCCGCG CCCGCTCGAC GGCGTGGCCC CCTTCGTCTG GCATGGCTCC 
ATCCGCACGC CGCAGATCGC CGAAGTGGCC GCCTACTACG GCGACGGCTT CTTCGCCAAC 
AACATCTTCT GGCCCAAGGA GCACTACCAG CAGCTGATCG GTCTCTACCG CGAACGCTAC 
GAGCACTACG GCCACGGCAA GGCAGACCAG GCCATCGTCG GCCTCGGCGG CCAGTTCTTC 
ATGCGGAAGA ACTCCCAGGA CGCGGTCAAG GAGTTCCGCC CGTACTTCGA TAACGCCCCG 
GTCTACGGCC ACGGCCCCTC GCTGGAGGAC TTCACCTCGC AGACCCCGCT GACGGTCGGC 
AGCCCGCAGG AAGTCATCGA AAAGACCCTC ACCTTCCGCG AGTACTTCGG CGACTACCAG 
CGCCAGCTGT TCCTGATCGA CCACGCCGGC CTGCCCCTGA AGACCGTGCT GGAGCAGCTG 
GACCTGTTCG GCGAGGAGGT CCTGCCGGTA CTGCGCAGGG AGTATGCCGC CCTCACCCCC 
GCCCACGTCC CGGAACCGCC CACCCATGCC GGCCGGGTGG CAGCCCGGAT GGCTGCCCAG 
GTGCAGGAGG ACTCACTCAC CAAGCCCACG GCACAGGACG CGTGA

Protein sequence

MQIGVFSVSD ITTDPTTGRT PTEHERIKAS VAIAKKVEEI GMDVYAIGEH HNRPFFSSSP 
TTTLAYIAAQ TERIILSTAT TLITTNDPVK IAEDFAMLQH LADGRVDLVM GRGNTAPVYP 
WFGKNIQDGI ELAIENYSLL RRLWDEDTVN WSGKHRTPLQ NFTSTPRPLD GVAPFVWHGS 
IRTPQIAEVA AYYGDGFFAN NIFWPKEHYQ QLIGLYRERY EHYGHGKADQ AIVGLGGQFF 
MRKNSQDAVK EFRPYFDNAP VYGHGPSLED FTSQTPLTVG SPQEVIEKTL TFREYFGDYQ 
RQLFLIDHAG LPLKTVLEQL DLFGEEVLPV LRREYAALTP AHVPEPPTHA GRVAARMAAQ 
VQEDSLTKPT AQDA