Gene Clim_1017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1017
Symbol
ID	6355466
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	1111615
End bp	1112652
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	61%
IMG OID	642668640
Product	Radical SAM domain protein
Protein accession	YP_001943071
Protein GI	189346542
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGTTAT CCATGGTATC CTCCCTGATG CTCGTGGTGA CGACGGCATG CAATCTCTCC 
TGCCGCTACT GCTATGAAGG AGGTCGCCGT TCCGGGGAGT TCATGAGCCT CGATACGGCC 
CTCTGTGCGC TCGACGTGGC GGCCCGGAGG GGGAGGCCCT TCCATGTACA GTTCACAGGG 
GGGGAGCCGC TGCTTGCAGC AGATCTTGTC TTCGCCGTTC TCGAACATAT CGCCGCCGAG 
GCTCTGCCGG CGACGACGGC CATCCAGACA AACGGCATAT TGCTCAACCG CGACGCCGTG 
CGAAAGTTCA GGGCGCACAG GACCGCAGTA GGCATAAGCG TGGACGGTCT GCCGGGAATA 
CAGGAGCGGA TGCGGGGCCA GAGTGCGGCA ACCTACAGGG CCATGCGGAT ACTCGATGAC 
GAAGGGGTCC CCTTCAGCGT CACCACGGTG CTTTCCGCCG TGAATACCGG AGAGCTTGCA 
AAGCTTGCCA TGGCCCTGCA CTCCTGGCCA ACGGCTTCGG CTATCGGACT CGACCTGCTG 
GTGCGCAAAG GCTCTGCATC TCCGGGAAGC GGGATCGAAC CGCCTGAAGA GGCGCTGTTG 
CGCCAGGGCA TAGGGGGGCT GCTCGGCACC CTCGACCTGC TGAACCGTGA ACGAAGGCAT 
CCTCTTGTCC TTCGGGAAAA ACAGCTGGTA CAGAGGGCCT TGAAAAACGC CGTTACGGCA 
GCACCCTACT GTTCCGCCTG CACCGGAGCG AGCCTCGCCA TTACGCCCGG AGGGGAGCTC 
TACCCCTGCA CCCAGACCAT GGGGGATCCT GATTTTTTTC TCGGAACGCT CGCCCGCCCC 
GACATGTCGC CTTCCCGAAC CTTTGCCGGA GAGTCTCCGG TCAGGGAAGG GTGCTCCGGC 
TGCGTGCTCG ATGGGCGCTG TCCGGGTGAC TGCCCGTCCC GGATGCATTA CAACAGAGGG 
AACCAGTGCG ACCTCGTCTG TACGCTCTAT CGAACCATCT ACGATTACTG CAAGCAAACA 
GGAGAAATTC CATCATGA

Protein sequence

MMLSMVSSLM LVVTTACNLS CRYCYEGGRR SGEFMSLDTA LCALDVAARR GRPFHVQFTG 
GEPLLAADLV FAVLEHIAAE ALPATTAIQT NGILLNRDAV RKFRAHRTAV GISVDGLPGI 
QERMRGQSAA TYRAMRILDD EGVPFSVTTV LSAVNTGELA KLAMALHSWP TASAIGLDLL 
VRKGSASPGS GIEPPEEALL RQGIGGLLGT LDLLNRERRH PLVLREKQLV QRALKNAVTA 
APYCSACTGA SLAITPGGEL YPCTQTMGDP DFFLGTLARP DMSPSRTFAG ESPVREGCSG 
CVLDGRCPGD CPSRMHYNRG NQCDLVCTLY RTIYDYCKQT GEIPS